Help - Search - Members - Calendar
Full Version: A Bangla Spell Checker is urgently necessary
OmicronLab Community > Avro Keyboard - Unicode Compliant Free Bangla Typing Software > Wish a feature for Avro Keyboard
paltan
Dear Developers,



In this country, we don't get any good things by paying it's cost but you made a excellent job at free of cost. We all should appreciate you. I have a request to add a feature to avro keyboard. I hope you'll give it a serious and kind attention. A Bangla Spell Checker is realy necessary when

we type in bangla. Bangla spelling is very much hard. We can leave it on computer's spell checking option. So, our developers can develop a unicode based dictionery to add with avro key board to spell checking. This dictionery can be used seperately to look up a meaning of a bangla word.



Anyone can coment on this idea & I am waiting for reply/feedback from our developers and administrator of this forum.



Thanks to all pepole involved in this.





Best Regards,



Paltan Laskar.






Mehdi Hasan
Thanks Mr. Paltan.

The good news is, We've started working for the next release of Avro Keyboard, where you can hope to have a spell checker.
(Anyway, this is not an official announcement, decisions may be changed anytime based on development complexity. The spell checker may also be a separate freeware product.)
uchchwhash
dear developers,
please please please... we all love you guys so much... our love for you will be mulitiplied... by... ummm... think of a big number...
if you can provide an autocompletion feature with phonetic keyboard. the idea is of course when you type a word based on the phonetic structure typed so far a short list should appear that matches the phonetics (modulo the ambiguity of typing bangla in roman letters like ড় = র, ত = ট, ন = ণ, ং = ঞ = ঙ) and of course the advantage of having a spell checker will be to prompt the dictionary words to the front of the list)
it's not hard, not hard at all... could you could you could you please...
bounce.gif
Mehdi Hasan
Ya, we can, and we will... smile.gif

Just keep in touch.
Wolverine
বাংলায় তো একই শব্দের নানান বানান আছে ... যেমন বাড়ি- বাড়ী ইত্যাদি।
Russel Ahmed Apu
QUOTE(Wolverine @ Nov 20 2006, 12:48 AM) *
বাংলায় তো একই শব্দের নানান বানান আছে ... যেমন বাড়ি- বাড়ী ইত্যাদি।




আমি এই বাংলা সফটওয়্যার টি দেখে এক্কেবারে অভিভূত। ভাল কাজ করেছেন। ধন্যবাদ।

[/size]

এখন যেটা সবচেয়ে বেশি প্রয়োজন সেটা হলো একটি বানান শোধক।



[size="4"]please include the spell checker as early as possible.


pervez
QUOTE(Administrator @ Aug 8 2006, 03:03 PM) *
Thanks Mr. Paltan.

The good news is, We've started working for the next release of Avro Keyboard, where you can hope to have a spell checker.
(Anyway, this is not an official announcement, decisions may be changed anytime based on development complexity. The spell checker may also be a separate freeware product.)




সুনীল তুমি ঠিকই লিখেছিলে, ‌'কেউ কথা রাখেনি।' এমন কি মেহেদী হাসানও।

অভ্র (৪.০.২) দিয়ে তিনি আমাদের যতই খুশিতে 'হাসান' না কেনও ওই 'বানান

সামলানোর' সফটওয়্যার না দিয়ে আজতক ততটাই 'কাঁদান।' এখন অবশ্য রাগ বা ক্ষোভের অবকাশ কম, পরীক্ষায় তিনি দিন কাটান। যাক আর কটা দিন সবুর করে দেখি কি 'রসুন' তিনি বুনেছেন!!!

shubhra
http://jewelosman.wordpress.com/2007/06/11/bspell13/ দেখতে পারেন।

Bangla Bhai
QUOTE(shubhra @ Jun 11 2007, 01:08 PM) *

http://jewelosman.wordpress.com/2007/06/11/bspell13/ দেখতে পারেন।



হুমম, উনি ডেভেলোপার না হয়েও অনেক ভালো করেছেন [মেহদী ভাইও অবশ্য ডেভেলোপার না, ডাক্তার biggrin.gif ]। তবে, এটি আসলে জেনেরিক স্পেল চেকার না, এটি ওয়ার্ড বেসড্‌ স্পেল চেকার।

আশা করি, উনি এর আরও উন্নতি সাধন করবেন smile.gif ...
uunmatal tarunno
খালি স্পেল চেকার না, ব্লগটাও জটিল।
Mehdi Hasan
QUOTE(Bangla Bhai @ Jun 11 2007, 02:44 PM) *

QUOTE(shubhra @ Jun 11 2007, 01:08 PM) *

http://jewelosman.wordpress.com/2007/06/11/bspell13/ দেখতে পারেন।



হুমম, উনি ডেভেলোপার না হয়েও অনেক ভালো করেছেন [মেহদী ভাইও অবশ্য ডেভেলোপার না, ডাক্তার biggrin.gif ]। তবে, এটি আসলে জেনেরিক স্পেল চেকার না, এটি ওয়ার্ড বেসড্‌ স্পেল চেকার।

আশা করি, উনি এর আরও উন্নতি সাধন করবেন smile.gif ...



সেটাই। এটা মূলতঃ স্পেল চেক করে না, স্পেল সাজেস্ট করে। ওনার কাজের প্রশংসা ব্লগেই করে এসেছি। আন্তরিক ভালোবাসা না থাকলে কেউ এতটা করে না বোধহয়। আজই একটা আপডেট রিলিজ করলেন...

rifle.gif @ বাংলা ভাই , খবর আছে কইলাম argue.gif
uunmatal tarunno
QUOTE(Mehdi Hasan @ Jun 11 2007, 11:01 PM) *

rifle.gif @ বাংলা ভাই , খবর আছে কইলাম argue.gif



এ এক দুদার্ন্ত কাহিনী। নায়ক পেশায় বৈদ্য (হাফ) কিন্তু সে তা লুকোতে চায় কেন?

এদিকে বাংলু মিয়া তার ছদ্মবেশ ফাঁসিয়ে দিল... কিন্তু কি তার স্বার্থ?

অতপরঃ নায়কের তর্জনের সাথে গর্জন... হুমকি সাথে ধমকি... কিন্তু একি বৈদ্যের হাতে অস্ত্র কেন?

এ এক অসাধারণ হাফ কমেডি, ফুল অ্যাকশন, প্যারা মেলো ড্রামা। দেখতে হলে দেখুন বাংলার সেরা ছবি, তিন তিনবার (!) -স্কার প্রাপ্ত, প্রাপ্তবয়স্কদের সামাজিক প্রামাণ্যচিত্র ...


"বাংলা ভাই, খবর আছে!"


(সংবিধিবদ্ধ সতর্কীকরণ: পরিচালক কিন্তু আমি না। অতএব পঁচা ডিমগুলো আমার দিকে ছুঁড়বেন না প্লীজ...)



Mehdi Hasan
হা হা হা হা হা

ভাইরে হাফ কমেডিতেই যেই হাসি দিলাম, ফুল থাকলে ফুসফুস ফুল হয়ে ফাইটা যাইবার পারত, বাঁচোয়া!





তয় বাংলু মিয়ার খবর আছে, নিস্তার নাই,
rifle.gif
ডিচিয়া
ডিচিয়া চু
ধুম
pervez


তয় বাংলু মিয়ার খবর আছে, নিস্তার নাই,
rifle.gif
ডিচিয়া
ডিচিয়া চু
ধুম
[/quoize]



[size=7] bounce.gif ডাক্তার মানে ডাকাত +মোক্তার=ডাক্তার বাল্য বয়সেই শিখেছিলাম। ডাক্তার যদি অস্ত্র হাতে নেয় তা হলে বুঝতে হবে.... একটু দাড়ান কি বুঝতে হবে সেটা আমি এখনো বুঝে উঠতে পারি নাই। পারলে আপনাদের জানাবো। kicking.gif
uunmatal tarunno
QUOTE(pervez @ Jun 12 2007, 03:22 PM) *

rifle.gif
ডিচিয়া
ডিচিয়া চু

ধুম



আওয়াজ শুইনা আমার আরেকটা থুড়ি আরেকগুচ্ছ সিনেমার কথা মনে পইড়া যাইতেছে। "Band of Brothers".
(যারা জানেন না তাদের বলি, এইটা দ্বিতীয় বিশ্বযুদ্ধের সিনেমা। পর্ব আছে ১০টা)





@ পারভেজ ভাই। আপনার প্রোফাইলে email address -টা পেলাম না বলে এখানেই বলতে হচ্ছে। আপনি কি আমাকে একটু মেইল করবেন?
Mehdi Hasan
QUOTE(uunmatal tarunno @ Jun 12 2007, 08:49 PM) *

@ পারভেজ ভাই। আপনার প্রোফাইলে email address -টা পেলাম না বলে এখানেই বলতে হচ্ছে। আপনি কি আমাকে একটু মেইল করবেন?


কানে কানে বলি, মডারেটররা কিন্তু সবাইকে পি.এম. করতে পারেন, মেম্বারও সেই পি.এম. এর রিপ্লাই দিতে পারেন মডারেটর অথবা অ্যাডমিন দের।
pervez





@ পারভেজ ভাই। আপনার প্রোফাইলে email address -টা পেলাম না বলে এখানেই বলতে হচ্ছে। আপনি কি আমাকে একটু মেইল করবেন? sad01_anim.gif
[/quote]



biggrin.gif মেইল করলাম। তবে একটু মেইল কি করে করতে হয় জানিনা বলে পুরাপুরি মেইল করলাম। আমার এমন কম বিদ্যাবুদ্ধিতে মাইন্ড করলে মনে বড়ই কষ্ট পাইবো। jump.gif

uunmatal tarunno
QUOTE(Mehdi Hasan @ Jun 13 2007, 12:46 AM) *

কানে কানে বলি, মডারেটররা কিন্তু সবাইকে পি.এম. করতে পারেন, মেম্বারও সেই পি.এম. এর রিপ্লাই দিতে পারেন মডারেটর অথবা অ্যাডমিন দের।


blink.gif টেরাই মেরেছিলুম তো। Not Permitted দেখালো যে... bounce.gif
alamgir
Hello
I have just released a spell checker (not a dictionary). I believe the internal algorithms are good enough in giving suggestions. But the world list I used is the one from Ankur. The list has numerous buggy words and doesnt have a number of common words.

It would take some time to modify such a big list.

You are welcome to judge the software. It doesnt need .net or other things, but might need VC runtime if you already dont have. The software is protected to have a 60 days unlimited runs lifetime.

Download: http://www.apona-bd.com/apona-banan/bangla...download-2.html


alamgir
Mehdi Hasan
Thanks for the information Alamgir Bhai.

What's the price of it if someone wants to buy?
alamgir
QUOTE(Mehdi Hasan @ Jul 1 2007, 02:58 PM) *

What's the price of it if someone wants to buy?


Havent thought much. A good word list is needed before selling. it's extremely time consuming to improve the list. Price could be different for BD and non-BD/overseas people. There would be some complementary copies too:)


alamgir


alamgir

A Linux version has been released last night. It's deb package so Debian and Ununtu users should be able to install and use it without much problem.

Read more here.

alamgir

Mehdi Hasan
Wow! Great news!!! Carry on bro... smile.gif
debashis
This spell checker for Linux is in debian format. Here is how to use it in other linux distributions:

ar x aponabana.1.01.deb

This will create data.tar.gz. Extract that file, you will get the executable and the dictionary. Run the executable. If you get shared library error. Download the required shared library and install.

Thanks Alamgir for this Linux port. Good work :-)

One point though, it is loading realy slow. My system is 1.7 GHz Core 2 Duo with 2GB RAM and SATA HDD with FC6. It took nearly 3 minutes to load the db and show the actual interface. :-(

alamgir
QUOTE(debashis @ Jul 11 2007, 05:38 PM) *
This spell checker for Linux is in debian format. Here is how to use it in other linux distributions:

ar x aponabana.1.01.deb

This will create data.tar.gz. Extract that file, you will get the executable and the dictionary. Run the executable. If you get shared library error. Download the required shared library and install.

Thanks Alamgir for this Linux port. Good work :-)

One point though, it is loading realy slow. My system is 1.7 GHz Core 2 Duo with 2GB RAM and SATA HDD with FC6. It took nearly 3 minutes to load the db and show the actual interface. :-(



Thanks debashis.

I value your comment on the loading time. It loads in less than a second on win. my system is c2d 1.8 GHz/2G 667 ram.

The deb was built on a cheap Ubuntu box hving a p4 1.7G, and only 256 MB ram. I also noticed the slow loading time, but thought it is due to the system's low memory.

I really have to dig in to find the bogging part.

thanks again.

alamgir

Mehdi Hasan
Alamgir Bhai,
Why don't you announce this in the announcement section also? I know more people visit that section than here to find resources outside OmicronLab.

Anyway, I appreciate the good work. As the Linux version is free and run without limitations, I can place it on the third party tools section of our main site, if you need more exposure more OmicronLab. For downloading, people will be forwarded to your site/to the direct link you provide.

Let me know by PM/Mail if you need this, with a brief description.

QUOTE
One point though, it is loading realy slow. My system is 1.7 GHz Core 2 Duo with 2GB RAM and SATA HDD with FC6. It took nearly 3 minutes to load the db and show the actual interface. :-(


I'm also working on a spell checker for Windows. The optimization is a tough issue here. I guess Alamgir bhai is using metaphone/double metaphone/phonetic based algorithms in the dictionary. One suggestion here to Alamgir bhai (if I'm not wrong in guessing), instead of building metaphonic codes (you might be calling it suggestion list) on the fly at startup, port it with the dictionary and just load with the word list. This may save some loading time.
alamgir
QUOTE(Mehdi Hasan @ Jul 12 2007, 12:36 AM) *
Alamgir Bhai,
Why don't you announce this in the announcement section also? I know more people visit that section than here to find resources outside OmicronLab.

Google would pick omicron instead of me! (A checky way to gain!)

QUOTE

Anyway, I appreciate the good work. As the Linux version is free and run without limitations, I can place it on the third party tools section of our main site, if you need more exposure more OmicronLab. For downloading, people will be forwarded to your site/to the direct link you provide.

Let me know by PM/Mail if you need this, with a brief description.

Please wait until I fix the loading time issue.

QUOTE

I'm also working on a spell checker for Windows. The optimization is a tough issue here. I guess Alamgir bhai is using metaphone/double metaphone/phonetic based algorithms in the dictionary. One suggestion here to Alamgir bhai (if I'm not wrong in guessing), instead of building metaphonic codes (you might be calling it suggestion list) on the fly at startup, port it with the dictionary and just load with the word list. This may save some loading time.


The dictionary is a hashmap. Suggestion database is a different data structure. The algorithm of generating suggestions is very crucial. I dont build metaphonic code on loading. They are made during suggestions generation. Most of the time is spent on checking the correctness of words (as most words in a document are correct). The data structures/algorigthms are the opmial one in my findings. The problem is related with specific issues of Linux platform.
I'll have a Mac version in next week or so (if I can manage a copy of OSX) and will see.

alamgir

debashis
Dear Alamgir,

So, my systems are just the opposite of yours. My windows system is an old one - 800 MHz P3 with just 256 MB RAM. Your spell checker loads within 30 sec in my XP :-) Not bad at all.

It seems that Mehadi is also very active on Avro Spell checker :-).

-- debashis

alamgir

It's been fixed. The progress bar itself was to blame! Now loads in seconds.

alamgir
debashis
Alamgir,
I can't use the updated debian package. 'ar' is saying that its not a valid package. Is it properly uploaded?

-- debashis

Mehdi Hasan
And another problem with the Windows version:

Problem 1:
It simply doesn't work in Win 2000 (fresh install) as runtime file installing fails always. May be the C++ 2005 runtime installer needs a higher version of Windows installer which is not present in Win2k.

Problem 2:
In Windows Xp and 2003 Server (also fresh install), it requires reboot after installing runtime files and software, but the installer doesn't mention that. If I try to run the spell checker without restart, it fails for once, and if I try again, it says I have done clock manipulation!!!


Solution:
Instead of delivering runtime files separately as Windows installer, ship it with inno setup package and use always restart flag.
Mehdi Hasan
Another thing,
Dictionary is the heart of a spell checker. I appreciate what Ankur did, but I think you should modify the dictionary ASAP. It is not Unicode 4.1/5 compatible. Separate khanda ta (ৎ) is not present in the words. Again, there is a lot of unusual/uncommon usage of Hasanta, for example, more people prefer to write ছটফট instead of ছট্‌ফট্‌
alamgir
QUOTE(debashis @ Jul 12 2007, 05:49 PM) *
Alamgir,
I can't use the updated debian package. 'ar' is saying that its not a valid package. Is it properly uploaded?
-- debashis


Must have been a corrupt upload. Re-uploaded. Please try agian.

thanks

alamgir




QUOTE(Mehdi Hasan @ Jul 13 2007, 01:15 AM) *
Another thing,
Dictionary is the heart of a spell checker. I appreciate what Ankur did, but I think you should modify the dictionary ASAP. It is not Unicode 4.1/5 compatible. Separate khanda ta (ৎ) is not present in the words. Again, there is a lot of unusual/uncommon usage of Hasanta, for example, more people prefer to write ছটফট instead of ছট্ফট্

There are heaps if not thousands of them. neo +cha became umo + cha.

It's a huge list and beyond my time to ammend. A large number verbs have west bengal style, kortum, khetum, jetum etc. I am trying get someone digitise Bangla academy one. It would take a month or so I suppose.


alamgir

alamgir
QUOTE(Mehdi Hasan @ Jul 13 2007, 12:59 AM) *
And another problem with the Windows version:

Problem 1:
It simply doesn't work in Win 2000 (fresh install) as runtime file installing fails always. May be the C++ 2005 runtime installer needs a higher version of Windows installer which is not present in Win2k.

Franky havent got 2000 and havent tested. Thanks for the result. I might have to roll back to studio 6.

QUOTE

Problem 2:
In Windows Xp and 2003 Server (also fresh install), it requires reboot after installing runtime files and software, but the installer doesn't mention that. If I try to run the spell checker without restart, it fails for once, and if I try again, it says I have done clock manipulation!!!


Solution:
Instead of delivering runtime files separately as Windows installer, ship it with inno setup package and use always restart flag.


Thanks again. Clock manipulation warning is from the antihacking module. I'll some time to bundle the runtime with the setup.

alamgir
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Invision Power Board © 2001-2009 Invision Power Services, Inc.