1. হোম
  2. টিটিএস
  3. কিভাবে ছবির থেকে লেখা তুলবেন
প্রকাশের তারিখ টিটিএস

কিভাবে ছবির থেকে লেখা তুলবেন

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

apple logo২০২৫ অ্যাপল ডিজাইন অ্যাওয়ার্ড
৫ কোটি+ ব্যবহারকারী

আপনি কি কখনো কোনো ছবির ফাইলের দিকে তাকিয়ে ভেবেছেন, ইশ যেন জাদুর মতো এটাকে এডিট করা যায় এমন টেক্সটে বদলে ফেলা যেত?

এটা হতে পারে গুরুত্বপূর্ণ কোনো টুইটের স্ক্রিনশট, স্ক্যান করা ডকুমেন্ট বা হাতে লেখা নোটের ছবি—এই সব ছবি থেকে লেখা তুলতে চাওয়া একেবারেই স্বাভাবিক।

এখানেই আসে OCR বা অপটিক্যাল ক্যারেক্টার রিকগনিশন প্রযুক্তি। আমাদের ডিজিটাল জীবনে টেক্সট ব্যবহারে এটি একরকম গেম চেঞ্জার। এই গাইডে আপনি জানবেন কিভাবে ছবির থেকে লেখা তোলা যায়।

ছবি থেকে লেখা তোলার প্রয়োজনীয়তা কী?

অনেক সময় ছবি থেকে টেক্সট বের করা খুবই জরুরি হয়ে পড়ে। ধরুন, আপনার কাছে গুরুত্বপূর্ণ তথ্য থাকা পিডিএফ আছে, কিন্তু কিছুই বদলাতে পারছেন না।

বা ধরুন, JPG অথবা PNG ছবিকে টেক্সট ফাইলে রূপান্তর করতে হবে স্কুল, অফিস বা নিজের কাজে। ঠিক এখানেই ছবির লেখা তোলার দরকার পড়ে।

শুধু ছবি থেকে লেখা কপি করার জন্য নয়; তথ্য নিয়ে কাজকে ঝামেলাহীন, দ্রুত ও নমনীয় করাই আসল উদ্দেশ্য।

ধাপে ধাপে পদ্ধতি

চলুন দেখে নেই কিভাবে নানারকম টুল আর উপায় ব্যবহার করে খুব সহজে বিভিন্ন ছবি থেকে লেখা তোলা যায়।

লেখা তোলার শুরুটা কিভাবে?

ছবি থেকে লেখা তোলা বেশ সহজ একটি কাজ। আগে যে ছবি (JPG, PNG, GIF, BMP) থেকে টেক্সট চাই, সেটি বেছে নিন।

তারপর ব্যবহার করুন OCR টুল, যার মানে Optical Character Recognition। এই টুলটি আপনার ছবির লেখা চিনে নিয়ে এডিট করার মতো টেক্সটে রূপান্তর করে।

এই প্রযুক্তি ব্যবহার করা খুবই সহজ এবং কম্পিউটার ও আইফোনে চলে। ইংরেজি, ফরাসি, ইতালিয়ান, চাইনিজ, পর্তুগিজসহ অনেক ভাষাই বুঝতে পারে।

ইমেজ টু টেক্সট কনভার্টার ব্যবহার

ইমেজ টু টেক্সট কনভার্টার আসলে একধরনের OCR টুল। অল্প সময়ে ছবি থেকে লেখা তুলতে দারুণ কাজে দেয়।

শুধু আপনার ছবি আপলোড করুন, বাকিটা কনভার্টার নিজে থেকেই সামলে নেবে। স্ক্রিনশট বা পাতার ছবি বিনা ঝামেলায় এডিটেবল টেক্সটে বদলে যাবে।

অনলাইন OCR দিয়ে সহজ কপি/পেস্ট

অনলাইন OCR টুলগুলো খুব দ্রুত লেখা তোলার জন্য চমৎকার। ইন্টারনেটে সার্চ করলেই অনেক অপশন পাবেন, বেশ কয়েকটি আবার একেবারে ফ্রি।

শুধু JPEG বা অন্য ছবি আপলোড করুন, আর টুলটি সঙ্গে সঙ্গেই লেখা কপি–পেস্ট করার মতো করে দেবে। স্কুলের কাজ বা তাড়াহুড়োর প্রজেক্টে বেশ উপযোগী।

টিউটোরিয়ালে শিখুন

নতুন হলে চিন্তার কিছু নেই! অনলাইনে অনেক টিউটোরিয়াল আছে, যেখানে ধাপে ধাপে ছবি থেকে লেখা তোলার পদ্ধতি দেখে শিখতে পারবেন।

লেখা তোলার জন্য শীর্ষ ৫ টুল

ছবিকে টেক্সটে রূপান্তর করতে সঠিক টুল বেছে নেওয়া বেশ গুরুত্বপূর্ণ। এখানে দেখুন পাঁচটি সেরা অপশন, যেগুলো এই কাজকে করে তোলে সহজ, দ্রুত ও কার্যকর।

১. Adobe Acrobat DC

Adobe Acrobat DC শুধু PDF পড়ার জন্য না—এটি শক্তিশালী OCR টুলও, যা ছবি থেকে সহজেই লেখা বের করতে পারে।

অনেক পেশাদারের জন্য এটি খুবই সুবিধাজনক। অন্যান্য Adobe টুল আর Google Drive-এর সাথে মিলিয়ে ব্যবহার করা যায়, তাই নানাধরনের কাজে এটা বেশ দরকারি একটি পছন্দ।

২. OmniPage Ultimate

OmniPage Ultimate দ্রুত ও নির্ভুল লেখা তোলার জন্য পরিচিত। বড় ও ভারী কাজ সামলাতে দারুণ উপযোগী। নানা ধরনের ইমেজ ফাইলের সঙ্গে কাজ করতে পারে।

বেশি সংখ্যক স্ক্যান ডকুমেন্ট একসাথে এডিটেবল টেক্সটে বদলাতে সক্ষম। যাদের নিয়মিত অনেক কাগজপত্র সামলাতে হয়—তাদের জন্য এটি খুব ভালো টুল।

৩. Abbyy FineReader

Abbyy FineReader নানা ধরনের ফাইল ফরম্যাটের সাথে ভালোভাবে কাজ করে। মাইক্রোসফ্ট ওয়ার্ড, এক্সেল, আরও অনেক সফটওয়্যারের সাথেই এটি ব্যবহার করতে পারবেন।

ছবি থেকে লেখা তোলার ঝামেলা অনেক কমিয়ে দেয়। বিভিন্ন ধরনের ডকুমেন্ট নিয়ে একসাথে কাজ করতে চাইলে এই টুল বেশ সহায়ক।

৪. Readiris

সহজে ব্যবহার করা যায় এমন OCR চাইলে Readiris ব্যবহার করে দেখতে পারেন। এটি শুধু টেক্সট তুলেই নয়, ডকুমেন্ট গুছিয়ে রাখা ও ব্যবস্থাপনায়ও সাহায্য করে। ফলে কাজ থাকে অনেক বেশি সুশৃঙ্খল।

৫. Rossum

Rossum একটু আলাদা ধরণের টুল। এটি মূলত ইনভয়েস থেকে তথ্য বের করতে কাজে লাগে। যারা দ্রুত ও নির্ভুলভাবে আর্থিক নথি সামলান—তাদের জন্য এটি দারুণ। Rossum স্বয়ংক্রিয়ভাবে কাজ করে, সময় বাঁচায় আর ভুল কমায়।

প্রতিটি টুলেরই আলাদা সুবিধা আছে। ছবি থেকে লেখা তোলার কনভার্টার, ইমেজ ফাইল থেকে লেখা কপি করার টুল বা উইন্ডোজ ও ডক্সের সাথে ভালো চলে—এখানে প্রায় সবার প্রয়োজনের জন্যই কিছু না কিছু আছে।

যারা কোড করতে পছন্দ করেন, তাদের জন্য Tesseract-OCR আর পাইথন ভিত্তিক টুলও আছে—টেকনিক্যাল প্রজেক্টের জন্য একেবারে মানানসই।

যদি এমন কিছু চান, যেটা ব্যবহার করতে আলাদা করে ইন্সটল করতে হবে না, সেক্ষেত্রে অনলাইন টুলই আপনার জন্য যথেষ্ট হতে পারে।

এই টুলগুলোর সাহায্যে ছবির ওপর ডান-ক্লিক করে বা সহজ কয়েকটা ধাপেই লেখা তোলার কাজ শুরু করতে পারবেন, ছবি থেকে লেখা নেওয়া হয়ে যাবে একদম হাতের খেল।

লেখা তোলায় AI ও মেশিন লার্নিংয়ের ভূমিকা

AI ও মেশিন লার্নিংয়ের জন্য OCR প্রযুক্তি আরও অনেকটা স্মার্ট হয়েছে। জটিল ফরম্যাট—যেমন হাতের লেখা বা সোশ্যাল মিডিয়া স্ক্রিনশটের মতো—সেখান থেকেও এখন বেশ নির্ভুলভাবে টেক্সট তোলা যায়।

এই টেকনোলজি এখন নিজে নিজে শিখে ক্রমেই আরও কার্যকর ও নির্ভুল হয়ে উঠছে।

লেখা তোলার প্রযুক্তিতে ভবিষ্যতের ধারা

লেখা তোলার ভবিষ্যৎ বেশ উজ্জ্বল। স্বয়ংক্রিয়তা আরও বাড়বে, OCR টুলগুলো বিভিন্ন API-র সঙ্গে ইন্টিগ্রেট হয়ে জটিল তথ্য তোলার কাজও সহজ করে দেবে।

ড্র্যাগ অ্যান্ড ড্রপ-এর সুবিধাও আরও বাড়ছে, যেখানে শুধু ছবি টেনে ফেলেই সঙ্গে সঙ্গে ফল পেয়ে যাবেন।

ভাষার সমর্থন বাড়লে, এই টুলগুলো সারা বিশ্বেই আরও সহজলভ্য ও ব্যবহারবান্ধব হয়ে উঠবে।

লেখা তোলার প্রযুক্তি, বিশেষত OCR, আমাদের ডিজিটাল দুনিয়ায় টেক্সট ব্যবহারের অভ্যাসই বদলে দিয়েছে।

সহজ JPG-কে এডিটেবল ওয়ার্ড ডকুমেন্টে রূপান্তর করা হোক কিংবা জটিল পিডিএফ আর এক্সেল ফাইল সামলানো—সব ক্ষেত্রেই OCR টুল এখন একেবারে অমূল্য।

এগুলো শুধু সফটওয়্যার না; আরও কার্যকর ও সংযুক্ত ডিজিটাল অভিজ্ঞতার একধরনের দরজা। আপনি ছাত্র, পেশাজীবী বা শুধু মাঝে মাঝে ছবি থেকে লেখা কপি করার দরকার পড়ে—সবার কাজই OCR প্রযুক্তি অনেক সহজ করে দেয়।

Speechify Text to Speech-এ TTS আরামে উপভোগ করুন

লেখা তোলা আর OCR দুনিয়ায় Speechify Text to Speech হতে পারে বেশ কার্যকর সঙ্গী।

আপনি iOS, Android, PC বা Mac যাই ব্যবহার করুন, Speechify সহজে আপনার লেখা পড়া কথায় রূপান্তর করে spoken words-এ, যা বিভিন্ন ভাষায় আরামে শুনতে পারবেন।

শব্দ শুনে যাঁরা শিখতে পছন্দ করেন বা স্ক্রিনের দিকে কম তাকিয়ে থাকতে চান, তাঁদের জন্য আদর্শ। বিভিন্ন ডকুমেন্ট থেকে তোলা লেখাও এখন পরিষ্কার, স্বাভাবিক উচ্চারণে শোনা যাবে।

শুধু পড়া নয়; একেবারে নতুনভাবে নিজের লেখা অনুভব করতে পারবেন। Speechify Text to Speech ব্যবহার করে দেখুন আর ডিজিটাল টেক্সটকে করে তুলুন আরও ব্যক্তিগত ও আকর্ষণীয়।

জিজ্ঞাসা ও উত্তর

OCR টেকনোলজি কি অদ্ভুত ফন্ট ও ছবি লেআউট থেকেও লেখা তুলতে পারে?

OCR প্রযুক্তি এখন অনেক উন্নত, নানা ধরনের ফন্ট ও লেআউট চিনতে পারে এবং সেখান থেকে লেখা তুলতে সক্ষম।

তবে, খুব ব্যতিক্রমী ফন্ট বা জটিল লেআউট—যেমন শিল্পময় লেখা বা খুব সাজানো নথির ক্ষেত্রে ফল ভিন্ন হতে পারে।

মূলত টুলের সক্ষমতার ওপরই নির্ভর করে কতটা নিখুঁতভাবে লেখা উদ্ধার হবে। কিছু উন্নত সফটওয়্যার এসব চ্যালেঞ্জিং ফরম্যাটও বেশ ভালোভাবে চিনতে পারে।

OCR ব্যবহারে ছবির লেখার ফরমেটিং কি ঠিক থাকে?

OCR ছবিকে টেক্সটে রূপান্তর করলে শুধু লেখা নয়, অনেক আধুনিক অ্যাপ্লিকেশন মূল ফরমেটিংও যতটা সম্ভব ঠিক রাখার চেষ্টা করে।

এর মধ্যে লেআউট, ফন্ট স্টাইল ও সাইজ সবই পড়ে, যা ব্রোশিওর বা ফ্লায়ারের মতো নথির ক্ষেত্রে বেশ গুরুত্বপূর্ণ।

তবে, ফরমেটিং ঠিক রাখা কতটা সম্ভব হবে তা টুলের ক্ষমতা আর মূল লেআউট কতটা জটিল তার ওপর নির্ভর করে।

OCR দিয়ে কি ছবি থেকে বিভিন্ন ভাষায় লেখা রূপান্তর করা যায়? কতটা নির্ভুল?

হ্যাঁ, আধুনিক OCR অনেক ভাষা সমর্থন করে—ফরাসি, চাইনিজ, পর্তুগিজসহ আরও অনেক। নির্ভুলতা মূলত টুলে থাকা ভাষার ডেটাবেস আর নানা অক্ষর চেনার ক্ষমতার ওপর নির্ভরশীল। নিয়মিত আপডেট ও বেশি ভাষার সমর্থন থাকলে, বহু ভাষার টেক্সট তোলার ক্ষেত্রেও এসব টুল আরও নির্ভুল হয়।

অত্যাধুনিক AI কণ্ঠস্বর, সীমাহীন ফাইল আর ২৪/৭ সহায়তা উপভোগ করুন

বিনামূল্যে ব্যবহার করে দেখুন
tts banner for blog

এই নিবন্ধটি শেয়ার করুন

Cliff Weitzman

ক্লিফ ওয়েইৎজম্যান

Speechify-এর সিইও ও প্রতিষ্ঠাতা

ক্লিফ ওয়েইৎজম্যান ডিসলেক্সিয়ার পক্ষে সোচ্চার এবং Speechify-এর সিইও ও প্রতিষ্ঠাতা। Speechify হলো বিশ্বের #1 টেক্সট-টু-স্পিচ অ্যাপ, যার ১,০০,০০০+ ৫-তারকা রিভিউ এবং অ্যাপ স্টোরে সংবাদ ও ম্যাগাজিন শ্রেণিতে শীর্ষ স্থান। ২০১৭ সালে, ওয়েইৎজম্যান Forbes 30 Under 30-এ ছিলেন, ওয়েব আরও সহজলভ্য করতে তার অবদানের জন্য। ক্লিফ ওয়েইৎজম্যান EdSurge, Inc., PC Mag, Entrepreneur, Mashable-সহ নানা শীর্ষ মিডিয়ায় আলোচিত হয়েছেন।

speechify logo

স্পিচিফাই সম্পর্কে

#১ টেক্সট-টু-স্পিচ রিডার

স্পিচিফাই পৃথিবীর শীর্ষস্থানীয় টেক্সট-টু-স্পিচ প্ল্যাটফর্ম, যা ৫ কোটি+ ব্যবহারকারীর কাছে ভরসাযোগ্য এবং এর টেক্সট-টু-স্পিচ iOS, অ্যান্ড্রয়েড, ক্রোম এক্সটেনশন, ওয়েব অ্যাপ আর ম্যাক ডেস্কটপ অ্যাপসে ৫ লক্ষ+ ফাইভ-স্টার রিভিউ পেয়েছে। ২০২৫ সালে অ্যাপল স্পিচিফাই-কে মর্যাদাপূর্ণ অ্যাপল ডিজাইন অ্যাওয়ার্ড প্রদান করে WWDC-তে এবং একে বলে, “মানুষের জীবনে দারুণ সহায়ক একটি গুরুত্বপূর্ণ রিসোর্স।” স্পিচিফাই ৬০+ ভাষায় ১,০০০+ প্রাকৃতিক কণ্ঠ নিয়ে প্রায় ২০০ দেশে ব্যবহৃত হচ্ছে। সেলিব্রিটি কণ্ঠের মধ্যে রয়েছে স্নুপ ডগ আর গুইনেথ পেল্ট্রো। নির্মাতা ও ব্যবসার জন্য স্পিচিফাই স্টুডিও উন্নত সব টুল দেয়, যার মধ্যে রয়েছে AI ভয়েস জেনারেটর, AI ভয়েস ক্লোনিং, AI ডাবিং আর AI ভয়েস চেঞ্জার। স্পিচিফাই-এর উচ্চমানের এবং খরচ-সাশ্রয়ী টেক্সট-টু-স্পিচ API-এর মাধ্যমে অসংখ্য শীর্ষ পণ্য সম্ভব হয়েছে। দ্য ওয়াল স্ট্রিট জার্নাল, CNBC, Forbes, TechCrunch এবং অন্যান্য বড় সংবাদমাধ্যমে স্পিচিফাই নিয়ে প্রতিবেদন প্রকাশিত হয়েছে; এটি বিশ্বের সর্ববৃহৎ টেক্সট-টু-স্পিচ প্রদানকারী। আরও জানতে ভিজিট করুন speechify.com/news, speechify.com/blog এবং speechify.com/press