1. Ana Sayfa
  2. Erişilebilirlik
  3. Fotoğraftan metni sesli okuma — Bir sayfanın fotoğrafını çekip sesli olarak okutma nasıl yapılır
Erişilebilirlik

Fotoğraftan metni sesli okuma — Bir sayfanın fotoğrafını çekip sesli olarak okutma nasıl yapılır

Cliff Weitzman

Cliff Weitzman

Speechify'in CEO'su ve Kurucusu

apple logo2025 Apple Tasarım Ödülü
50M+ Kullanıcı

TTS okuyucularına yoğun talep var ve pek çok seçenek mevcut. Peki bu, tüm metinden sese teknolojilerinin aynı performansı sunduğu anlamına mı geliyor? Birçok TTS ekran okuyucu, Microsoft Word belgelerinden, HTML web sayfalarından veya başka metin dosyalarından kopyalanıp yapıştırılan dijital metni işleyebiliyor. Ancak çok azı, kilitli dijital ve fiziksel metni görsellerden alıp doğal, kulağa gerçekçi gelen bir sesli anlatıma dönüştürebiliyor. Bunu yapabilenler ise optik karakter tanıma (OCR) teknolojisi kullanıyor.

OCR nedir?

OCR, yani optik karakter tanıma ya da metin tanıma, özel veri çıkarımı için geliştirilmiş bir teknolojidir. Pek çok iş uygulaması olduğu gibi eğlence ve kişisel kullanım açısından da oldukça faydalıdır. Genellikle iki bileşenden oluşur: Görselleri tarayan bir donanım bileşeni ve verileri çıkarıp kullanmanızı sağlayan bir yazılım bileşeni. Ancak yazılım kısmı işin en heyecan verici ve en karmaşık bölümüdür. OCR yazılımları, tekil harfleri ve kelimeleri ayırıp cümleler halinde düzenleyebilir. Ayrıca, orijinal kilitli içeriği düzenlemenize de imkan tanır; tıpkı yalnızca görüntüden oluşan, kilitli metin içeren bir PDF dosyasını düzenlemek gibi.

OCR Nasıl Çalışır?

Optik Karakter Tanıma (OCR), taranmış kağıt belgeler, PDF dosyaları veya dijital kamerayla çekilmiş görseller gibi farklı belge türlerini düzenlenebilir ve aranabilir verilere dönüştüren bir teknolojidir. Bu süreç, OCR yazılımının belgenin görsel yapısını analiz etmesi ve metin içeren alanları tespit etmesiyle başlar. Ardından bu alanlar satırlara, kelimelere ve karakterlere ayrılır. Her karakter, önceden tanımlanmış desenlerle karşılaştırılır veya makine öğrenimi modelleriyle eğitilerek tanımlanır ve makine kodlu metne dönüştürülür. Böylece görseldeki metin düzenlenebilir, aranabilir ve dijital olarak işlenebilir hale gelir.

Metinden Sese ve OCR'yi Birleştirmek

Optik karakter tanıma ile metinden sese teknolojisinin birleşimi, erişilebilirlik ve verimlilik açısından son derece güçlü bir araçtır. OCR, taranmış belgelerden, görsellerden veya basılı materyallerden metni çıkarır ve bunu makine tarafından okunabilir metne dönüştürür. Bu metin daha sonra TTS sistemine aktarılır ve yazılı kelimeler sesli hale getirilir. Bu sinerji, görme engelli bireylerin basılı materyalleri "okuyabilmesinden", kitap ve belgelerin sesli kitaba dönüştürülmesine ya da basılı yabancı metinlerin anlık sesli çevirisine kadar pek çok kullanım olanağı sunar. OCR'nin TTS ile entegre edilmesiyle, kullanıcılar metinsel içerikle çok daha dinamik biçimde etkileşime geçebilir ve bilgi; okuma düzeyi veya görme engeli fark etmeksizin herkes için daha erişilebilir olur.

Metinden Sese OCR Kullanım Alanları

OCR ve TTS teknolojilerinin bir araya gelmesi, bilginin farklı durumlarda daha erişilebilir ve kolay tüketilebilir hale getirilmesi için birçok imkan sunar. İşte metinden sese OCR'nin bazı kullanım alanları:

  • Görme engellilere yönelik yardımcı teknoloji: Kitaplardan, belgelerden veya ekranlardan yazılı içeriği konuşmaya dönüştürerek görme engelli ya da kör bireylerin içeriği "okumasına" yardımcı olur.
  • Öğrenme ve eğitim:
    • Disleksili öğrenciler için destek: Disleksi veya diğer okuma güçlüğü yaşayan öğrenciler için yazılı metni sese dönüştürerek yardımcı olur.
    • Çok modlu öğrenme: Öğrencilerin içeriği hem okuyup hem dinlemesini sağlayarak anlama ve akılda tutmayı geliştirir.
  • Çeviri ve dil öğrenimi: Yabancı dildeki yazılı metni konuşmaya dönüştürerek telaffuz ve anlama konusunda destek olur.
  • Dijital içerik tüketimi: Kitapları, haber makalelerini veya diğer basılı metinleri sesli kitap veya podcast gibi, hareket halindeyken dinlemenize imkan tanır.
  • Belge erişilebilirliği: PDF, taranmış belgeler ve diğer düzenlenemeyen formatları, sesli içeriğe ihtiyaç duyan veya tercih edenler için erişilebilir kılar.
  • Tarihi belge analizi: Eski el yazmalarını veya arşiv belgelerini sesli içeriğe çevirerek tarih araştırmacıları veya meraklıları için dinlenebilir hale getirir.
  • İş ve verimlilik: Basılı, dijital olmayan raporları meşgul profesyoneller için sesli içeriğe dönüştürür.
  • Düzeltme: Yazarların veya editörlerin, kağıttaki yazılı içerikteki hataları dinleyerek fark etmelerine yardımcı olur.
  • Eğlence: Çizgi romanlar, grafik romanlar veya ağırlıklı olarak görsel içeriğe sahip diğer materyalleri işitsel bir deneyime dönüştürür.

Bir Fotoğraftan Metni Sesli Okutma Nasıl Yapılır?

Her Apple ve Android mobil cihaz kullanıcısı, cihazlarında OCR teknolojisi ve temel metinden sese çeviri işlemleri yapabilen bir TTS okuyucu bulunduğunun farkında olmayabilir. Yerleşik TTS özelliklerini, size ücretsiz okuma yapan uygulamalar ya da kameradan metin okuyan ücretsiz uygulamalar gibi düşünebilirsiniz; ancak kaliteleri, daha gelişmiş metinden sese yazılımlar kadar iyi değildir. Android ve Apple cihazlarda görsellerden metin okuma özelliğine nasıl erişebileceğiniz aşağıda anlatılmaktadır:

Android

Android cihazlar, en azından Android 12 ve üzeri sürüm kullananlar, yerleşik bir TTS okuyucu ile gelir. Bu, navigasyon, küçük yazıları okuma vb. için işe yarayan bir araçtır. Ama ayrıca fotoğraflardan metin okumak için de kullanabilirsiniz. Cihazınızı ayarlamak için şunları yapın:

  • "Ayarlar" uygulamasından "Erişilebilirlik" menüsüne gidin.
  • "Seç ve Konuş" seçeneğini etkinleştirin.
  • TTS okuyucunun "Ayarlar" sekmesine gidin ve "Görüntülerdeki metni oku" seçeneğini açın.
  • Ana ekrana dönün ve "Kamera" uygulamasını açın.
  • Kamerayı bir kitap, gazete veya dijital metin içeren başka bir ekrana doğru tutun.
  • Kamera uygulamasında bir kelimeye dokunmadan önce "Seç ve Konuş" butonuna basın.

Android TTS okuyucu, vurgulanan kelimeden itibaren okumaya başlar. Bir kelime işlemci kullanırken olduğu gibi, metin parçasını seçmek için parmağınızı ekran boyunca sürükleyerek metni işaretleyebilirsiniz.

Apple

iPhone'da fiziksel metni sesli okutmak için, çalışan bir kamera, iOS 15 ve üzeri bir sürüm ve etkinleştirilmiş yerleşik TTS okuyucu gerekir.

  • "Ayarlar" menüsünden "Erişilebilirlik" sekmesine gidin.
  • "Sesli İçerik" seçeneğine dokunun.
  • "Seçimi Konuştur" ve "Ekranı Konuştur" seçeneklerini etkinleştirin.
  • Ana ekrana geri dönün ve kamerayı açın.
  • Kamerayı bir sayfaya doğrultun ve alt araç çubuğunda "Canlı Metin" butonu görünene kadar bekleyin.
  • OCR ekran okuyucusunu etkinleştirmek için butona dokunun.
  • Sayfanın üstünden okumaya başlamak için iki parmağınızla aşağı doğru kaydırın.
  • Belirli bir kelime, cümle veya paragrafı yüksek sesle okutmak için ekranda bir kelimeye dokunun veya seçim yapın.

Android cihazlar gibi, iPad ve iPhone'larda da OCR ve TTS yetenekleri sınırlıdır. Metni tanıma doğruluğu ortalamanın üzerinde olsa da, ses kalitesi yapay ve robotik ton nedeniyle beklentinin altındadır.

Speechify — OCR Teknolojisine Sahip En İyi TTS

Yerleşik TTS okuyucular ve OCR yazılımları mobil cihazlarda güzel dursa da, kalite ve performans açısından pek de etkileyici değiller. Neyse ki güçlü bir alternatif metin okuma uygulaması var. Speechify, OCR teknolojisi ile metinden sese okuyucu ve yüksek kaliteli Yapay Zeka sesleri sunar. Varsayılan mobil metin okuyucularının çok ötesinde bir işlevselliğe sahiptir; tüm kitapları, fiziksel belgeleri tarayarak basılı metni dijital metne dönüştürebilir. Ardından karmaşık algoritmalar, doğal tonlara sahip, kontrol edebileceğiniz ve okuma hızını ayarlayabileceğiniz sesler üretir. Speechify metinden sese yazılımı aşağıdaki platformlarda kullanılabilir:

İster Apple App Store’dan ister Google Play Store’dan indirin, ister masaüstü Mac sürümünü ya da Chrome tarayıcı uzantısını yükleyin; tek bir lisans, Speechify'ı tüm masaüstü ve mobil cihazlarınızda kullanmanız için yeterlidir. Kullanıcı dostu arayüzü, her yaş grubundan ve her teknik seviyeden kullanıcıya hitap eder. Speechify OCR taramalarıyla eş zamanlı olarak çevrim içi okuma da yapabilirsiniz.

Disleksi, okuma güçlüğü, görme engeli olanlar ve aynı anda birden fazla işle uğraşan kullanıcılar için geliştirilmiş Speechify’ın yardımcı teknolojisi, sıradan tam ekran okuyuculardan çok daha fazlasını sunar. Hem dijital hem de basılı her türlü metni sesli kitaba dönüştürmenizi, podcastler oluşturmanızı ve daha az eforla, daha fazla odaklanarak okuma becerilerinizi geliştirmenizi sağlar. Ücretsiz Speechify metinden sese uygulamasını deneyin ve size özel, sürükleyici bir okuma deneyimi yaşayın. Speechify’ın ayrıca, dilediğiniz metni girerek seslerini deneyebileceğiniz çevrim içi bir Yapay Zeka Ses Üreticisi de bulunuyor.

En gelişmiş yapay zeka seslerin, sınırsız dosya ve 7/24 desteğin keyfini çıkarın

Ücretsiz Dene
tts banner for blog

Bu Makaleyi Paylaş

Cliff Weitzman

Cliff Weitzman

Speechify'in CEO'su ve Kurucusu

Cliff Weitzman, disleksi farkındalığı savunucusu ve dünyanın 1 numaralı metinden konuşmaya uygulaması Speechify'ın CEO'su ve kurucusudur. Speechify, 100.000'den fazla 5 yıldızlı yoruma sahip olup App Store'da Haberler & Dergiler kategorisinde birinci sırada yer almaktadır. 2017 yılında, interneti öğrenme güçlüğü yaşayan kişiler için daha erişilebilir kılmaya yönelik çalışmaları nedeniyle Forbes 30 Under 30 listesine seçilmiştir. Cliff Weitzman; EdSurge, Inc., PC Mag, Entrepreneur, Mashable ve diğer önde gelen yayınlarda kendisine yer verilmiştir.

speechify logo

Speechify Hakkında

#1 Metin Okuyucu

Speechify dünyanın önde gelen metin okuma platformudur; 50 milyondan fazla kullanıcıya sahip ve 500.000'den fazla beş yıldızlı yorumu ile güvenilir bir hizmettir. Speechify, iOS, Android, Chrome eklentisi, web uygulaması ve Mac masaüstü uygulamalarıyla öne çıkıyor. 2025 yılında, Apple, Speechify'a prestijli Apple Tasarım Ödülü’nü WWDC'de takdim etti ve “insanların yaşamlarını kolaylaştıran kritik bir kaynak” olarak tanımladı. Speechify; 60+ dilde 1.000+ doğal ses sunuyor ve neredeyse 200 ülkede kullanılıyor. Ünlü sesler arasında Snoop Dogg, Mr. Beast ve Gwyneth Paltrow bulunuyor. İçerik üreticileri ve işletmeler için Speechify Studio gelişmiş araçlar sunar: AI Ses Oluşturucu, AI Ses Klonlama, AI Dublaj ve AI Ses Değiştirici dahil. Speechify aynı zamanda uygun maliyetli ve yüksek kaliteli metin okuma API'si ile lider ürünlere güç katmaktadır. The Wall Street Journal, CNBC, Forbes, TechCrunch ve diğer büyük medya kuruluşlarında yer alan Speechify, dünyanın en büyük metin okuma sağlayıcısıdır. Daha fazlası için speechify.com/news, speechify.com/blog ve speechify.com/press adreslerini ziyaret edebilirsiniz.