Ο ιδρυτής του Speechify μιλά για το μέλλον της ΤΝ στο podcast Everyday AI
Είναι οι φωνές διασήμων το μέλλον της γενετικής ΤΝ; Είναι η ΤΝ ασφαλής; Ο ιδρυτής και CEO του Speechify, Cliff Weitzman, συζήτησε με τον Jordan Wilson στο επεισόδιο 152 του Everyday AI Podcast αυτά και πολλά ακόμη.
Podcast Everyday AI
Το podcast Everyday AI είναι ένα δημοφιλές, δωρεάν, καθημερινό livestream, podcast και newsletter που βοηθά τους ανθρώπους να εξελιχθούν επαγγελματικά με ΤΝ. Καλύπτει τα πιο πρόσφατα tips και τάσεις στη γενετική ΤΝ και δείχνει πώς να αξιοποιείτε την ΤΝ για επιτυχία. Από τον Απρίλιο 2023, το Everyday AI podcast έχει 22.000 ακροατές και 7.800 συνδρομητές, προσφέροντας γνώσεις και στρατηγικές ΤΝ για να δουλεύουν καλύτερα και να πετυχαίνουν με τη βοήθεια της τεχνητής νοημοσύνης.
Η ιστορία του Speechify
Ο Cliff Weitzman δημιούργησε το Speechify επειδή έχει δυσλεξία και διαπίστωσε ότι τα περισσότερα πανεπιστημιακά βιβλία δεν έχουν audiobook. Σήμερα είναι η #1 εφαρμογή μετατροπής κειμένου σε ομιλία στον κόσμο, με 150.000+ κριτικές 5 αστέρων και 25+ εκατ. χρήστες. Τόσο δημοφιλές που μέχρι και ο Snoop Dogg ήθελε συνεργασία! Ο Weitzman μίλησε γι’ αυτό στο επεισόδιο 152 του Everyday AI podcast, στις 27 Νοεμβρίου.
Πώς λειτουργεί το Speechify
Ο Weitzman εξήγησε ότι το Speechify βασίζεται στην καλύτερη μηχανή TTS με υψηλής ποιότητας παραγωγή φωνής με ΤΝ, μετατρέποντας άμεσα και οικονομικά κάθε κείμενο σε ομιλία. Είναι διαθέσιμο σε Android, Mac, iOS, web, Microsoft Edge και Chrome extensions. Δεν περιορίζεται σε ψηφιακά κείμενα – μέσω OCR και ΤΝ, μπορείς να φωτογραφίσεις σημειώσεις ή βιβλία και να τα ακούσεις σε ρεαλιστικό ήχο μέσα σε λίγα δευτερόλεπτα.
Χρήσεις & στόχος του Speechify
Με τη δυνατότητα ακρόασης και επισήμανσης κειμένου, οι χρήστες μαθαίνουν πιο γρήγορα και χωρίς κόπο. Έτσι, το Speechify έγινε απαραίτητο εργαλείο ΤΝ για μαθητές και όσους έχουν μαθησιακές δυσκολίες ή αναπηρίες, όπως δυσλεξία, ΔΕΠΥ, χαμηλή όραση, τύφλωση, αυτισμό, διάσειση και άγχος.
Αν και ξεκίνησε ως εργαλείο υποστήριξης για άτομα με μαθησιακές ιδιαιτερότητες, πλέον το χρησιμοποιούν όλοι: γιατροί, δικηγόροι, λογιστές, στρατιωτικοί, στελέχη, οικονομικοί αναλυτές, μαθητές γλώσσας και πολυάσχολοι επαγγελματίες που θέλουν καλύτερη παραγωγικότητα και ταχύτερη ανάγνωση, χάρη σε ρεαλιστικές φωνές και OCR.
Ο Weitzman τόνισε πως στόχος του Speechify είναι να διασφαλίσει ότι «η ανάγνωση δεν είναι ποτέ εμπόδιο στη γνώση, για κανέναν».
Φωνές διασήμων
Με την ανάπτυξη του Speechify, άνοιξε ο δρόμος για συνεργασίες με διασημότητες. Ο Weitzman και ο Wilson συζήτησαν πώς προέκυψε η συνεργασία με τον Snoop Dogg, που δανείζει τη φωνή του στη συλλογή του Speechify.
Πολλές συνεργασίες ξεκινούν όταν κάποιοι χρήστες επικοινωνούν απευθείας. Ο ατζέντης του Snoop Dogg πρότεινε να χρησιμοποιηθεί η φωνή του για το κοινό του. Έτσι, ο Weitzman βρέθηκε στο στούντιο του Snoop, όπου η φωνή του αντιγράφηκε με τεχνολογία αντιγραφής φωνής και σύνθεσης φωνής με ΤΝ.
Στις 200+ φωνές ΤΝ του Speechify σε διάφορες γλώσσες, περιλαμβάνονται π.χ. αγγλικά, κινεζικά, ισπανικά, πορτογαλικά, αλλά και η φωνή της Gwyneth Paltrow ως αφηγήτρια.
Ωστόσο, μαζί με αυτές τις φωνές διασήμων, εφαρμόζονται αυστηρά μέτρα ασφαλείας για αποφυγή κατάχρησης.
Ασφάλεια ΤΝ & αντιγραφή φωνής
Παρόλο που το Speechify βλέπει τα οφέλη της μετατροπής κειμένου σε ομιλία και της αντιγραφής φωνής με ΤΝ, ο Weitzman εξήγησε ότι κύριο μέλημα της Speechify είναι η προστασία δημιουργών και του κοινού, γιατί «η ασφάλεια ΤΝ είναι πολύ σημαντική».
Η εφαρμογή πολιτικών ασφάλειας έχει γίνει ακόμα πιο κρίσιμη από τότε που το Speechify διεύρυνε τις δυνατότητές του με νέα προϊόντα όπως το Speechify Studio, εργαλεία ΤΝ που επιτρέπουν δημιουργία voice overs ΤΝ, custom φωνών, μεταφράσεις ομιλίας, αυτόματη μεταγραφή, επεξεργασία βίντεο και χρήση AI avatars.
Ο Weitzman εξηγεί ότι το Speechify επιτρέπει μόνο την αντιγραφή της δικής σου φωνής ή κάποιου που βρίσκεται δίπλα σου και έχει δώσει συγκατάθεση (όχι μια τυχαία φωνή από το ίντερνετ), προστατεύοντας από κατάχρηση και παραβίαση προσωπικών ή πνευματικών δικαιωμάτων.
«Η φιλοσοφία μας στο Speechify βάζει τον κάτοχο δικαιωμάτων στο τιμόνι», δήλωσε ο Weitzman. Η τεχνολογία ΤΝ της Speechify δεν αποσκοπεί στην αντικατάσταση δημιουργών, αλλά στην ενίσχυση της δημιουργικότητάς τους, βοηθώντας τους να παράγουν περιεχόμενο πιο αποτελεσματικά.
Ο Weitzman ανέφερε επιπλέον πως ετοιμάζουν προϊόν που θα επιτρέπει στους χρήστες να διακρίνουν εύκολα αν μια φωνή είναι ανθρώπινη ή ΤΝ και, αν είναι ψεύτικη, πού δημιουργήθηκε – προσφέροντας προστασία από φωνητικές απάτες όπου μιμούνται φωνές αγαπημένων προσώπων.
Ακούστε τον Cliff Weitzman στο Everyday AI podcast
Για να δείτε πώς η ΤΝ μετατροπής κειμένου σε ομιλία του Speechify διαμορφώνει το μέλλον της μάθησης και της δημιουργίας, ακούστε το ειδικό επεισόδιο του Everyday AI podcast σε Apple Podcasts, Spotify ή παρακάτω:
Χρονοδείκτες podcast:
[00:12:50] Ασφάλεια στη μετατροπή κειμένου σε ομιλία
[00:18:12] Χρήσεις μετατροπής κειμένου σε ομιλία
[00:21:05] Ερωτήσεις κοινού
[00:24:10] Μέλλον μετατροπής κειμένου σε ομιλία
[00:27:28] Χάνει η γραπτή λέξη τη δύναμή της;
[00:31:30] Χρήση μετατροπής κειμένου σε ομιλία από επαγγελματίες

