1. الرئيسية
  2. واجهة برمجة التطبيقات (API)
  3. واجهة برمجة تطبيقات Deepgram

واجهة برمجة تطبيقات Deepgram: بوابتك لتحويل الكلام إلى نص بدقة عالية

Cliff Weitzman

كليف وايتزمان

الرئيس التنفيذي ومؤسس Speechify

واجهة برمجة تطبيقات سبيتشيفاي توفر وقت استجابة يبلغ 300 مللي ثانية، وأصواتاً بجودة بشرية، وأكثر من 50 لغة

apple logoجائزة آبل للتصميم لعام 2025
أكثر من 50 مليون مستخدم

ما هي Deepgram؟

Deepgram هي خدمة قوية للتعرّف على الكلام توفّر واجهات برمجة تطبيقات لنسخ الكلام المنطوق إلى نص مكتوب. بالاعتماد على نماذج تعلّم عميق متقدّمة، تستطيع Deepgram التعامل مع بيئات صوتية معقّدة ولهجات متنوّعة، وتدعم النسخ باللغة الإنجليزية وعدّة لغات أخرى.

الميزات الرئيسية لواجهة برمجة تطبيقات Deepgram

  1. النسخ اللحظي والمُسجّل مسبقاً: سواء أكان الصوت من بث مباشر أم من ملفات WAV مُسجّلة مسبقاً، تستطيع واجهة Deepgram نسخ كليهما بدقّة لافتة.
  2. تحويل الكلام إلى نص والنص إلى كلام: لا تقتصر قدرات Deepgram على نسخ البيانات الصوتية، بل تدعم أيضاً تحويل النص إلى كلام، لتتمكّن التطبيقات من «التحدّث» مع المستخدمين.
  3. زمن استجابة منخفض: في النسخ الفوري، التأخير عامل حاسم. تعمل Deepgram على تقليص التأخير إلى أدنى حد، ما يجعلها مثالية للتطبيقات التي تتطلّب استجابة فورية.
  4. تكاملات متعدّدة: تتكامل الواجهة بسلاسة مع بيئات برمجة مختلفة بما في ذلك Python وJavaScript وNode، بفضل حِزم SDK المتاحة على GitHub ضمن deepgram/sdk.
  5. مسارات عمل قابلة للتخصيص: يمكن للمستخدمين تخصيص سير النسخ، بما في ذلك التصفية والتلخيص وإجراء تحليل المشاعر على النص المنسوخ.

البدء مع Deepgram

لبدء استخدام واجهة Deepgram، ستحتاج إلى مفتاح API من Deepgram، ويمكنك الحصول عليه بالتسجيل في منصّتهم عبر api.deepgram.com. يقدّم التوثيق (أو "الـ docs") دليلاً شاملاً لإجراء أول استدعاء API، وإعداد رؤوس المصادقة، واستكشاف نطاق الإمكانات المتاحة.

حالات الاستخدام

تفتح مرونة واجهة Deepgram الباب أمام طيف واسع من الاستخدامات:

  1. دعم العملاء: نسخ وتحليل مكالمات العملاء لحظياً لتحسين الخدمة واستقاء الرؤى.
  2. الإعلام: إنشاء ترجمات تلقائية لمحتوى الصوت والفيديو.
  3. التعليم: تحويل المحاضرات والدروس إلى نص قابل للبحث والتحرير لتيسير الوصول والدراسة.
  4. الرعاية الصحية: نسخ محادثات الطبيب والمريض لتحسين حفظ السجلات والامتثال.

حِزم SDK وأمثلة الشيفرة لـ Deepgram

بالنسبة للمطوّرين، توفّر Deepgram حِزم SDK تُبسّط دمج واجهتها في التطبيقات القائمة. وهي متاحة لـ Python وJavaScript، ويمكن العثور عليها على GitHub، ويدعمها مجتمع مطوّرين نشط. تُظهر أمثلة الشيفرة كيفية التعامل مع بيانات الصوت، وإدارة استدعاءات API بشكل غير متزامن (async)، والتعامل مع البيانات الوصفية بكفاءة.

ميزات متقدّمة

لا تقتصر Deepgram على النسخ الأساسي:

  1. استخراج البيانات الوصفية: استخراج معلومات مفيدة مثل تمييز المتحدّثين وتحليل المشاعر من الكلام.
  2. نماذج مخصّصة: تدريب نماذج مخصّصة لمفردات أو بيئات متخصّصة، ما يرفع الدقّة للاحتياجات المحدّدة.
  3. تكاملات مع Microsoft: يضمن توافق Deepgram مع منتجات Microsoft إمكانية إدماجها في سير العمل المعتمد على منظومة Microsoft البيئية، بما يعزّز الإنتاجية.

سواء أكان الهدف تحسين تجربة العملاء، تبسيط سير العمل، أم مجرّد تحويل الكلام إلى نص، تبرز واجهة Deepgram كأداة قوية ومتعدّدة الاستخدامات في مجال تقنيات التعرّف على الكلام. ومع التوثيق الشامل، وحِزم SDK سهلة الاستخدام، ومجتمع داعم، تمهّد Deepgram الطريق لحلول مبتكرة للتعامل مع بيانات الصوت والنسخ.

الأسئلة الشائعة

تُستخدم واجهة برمجة تطبيقات Deepgram لنسخ الصوت في الوقت الفعلي والملفات المسجَّلة مسبقًا، وتحويل الكلام إلى نص عبر تقنية متقدمة للتعرّف على الكلام لحالات استخدام متعددة.

يوفّر نسخ Deepgram دقّة عالية، إذ يستفيد من نماذج تعلّم عميق متقدّمة للتعامل مع لهجات متنوّعة وبيئات صوتية صعبة.

واجهة برمجة تطبيقات التعرف على الكلام من Google ليست مجّانية بالكامل؛ فهي تتيح حصة مجانية محدودة، وبعدها تُحتسب رسوم بحسب حجم الصوت المُعالج.

تستخدم Deepgram نماذج تعلّم عميق مخصّصة ومُحسّنة لنسخ الصوت في الوقت الفعلي والملفات المسجَّلة مسبقًا، وقادرة على التعامل مع تدفّقات صوتية معقّدة وتكاملات متعددة.

وصول سريع وسهل إلى أصوات سبيتشيفاي المفضلة عبر واجهة برمجة التطبيقات – سريعة، قابلة للتوسّع، وسهلة الاستخدام للمطورين

احصل على وصول API
api access banner

شارك هذا المقال

Cliff Weitzman

كليف وايتزمان

الرئيس التنفيذي ومؤسس Speechify

كليف وايتزمان مدافع عن ذوي عسر القراءة والرئيس التنفيذي ومؤسس تطبيق Speechify، أفضل تطبيق لتحويل النص إلى كلام في العالم، إذ نال أكثر من 100,000 تقييم بخمس نجوم وتصدّر متجر التطبيقات ضمن فئة الأخبار والمجلات. في عام 2017، أدرجته فوربس ضمن قائمة 30 تحت 30 تقديراً لجهوده في جعل الإنترنت أكثر سهولة وصولاً لذوي صعوبات التعلّم. ظهر كليف وايتزمان في منصات مثل EdSurge وInc. وPC Mag وEntrepreneur وMashable، وغيرها من وسائل الإعلام الرائدة.

speechify logo

عن سبيتشيفاي

أفضل قارئ لتحويل النص إلى كلام

سبيتشيفاي هو المنصة الرائدة عالميًا لتحويل النص إلى كلام، يثق به أكثر من 50 مليون مستخدم ومدعوم بأكثر من 500,000 مراجعة خماسية النجوم عبر تطبيقاته الخاصة بتحويل النص إلى كلام على iOS، أندرويد، إضافة كروم، تطبيق الويب، وتطبيقات سطح المكتب لماك. في عام 2025، منحت آبل سبيتشيفاي جائزة Apple Design Award المرموقة في WWDC، واصفةً إياه بأنه “مورد أساسي يساعد الناس على عيش حياتهم.” يقدم سبيتشيفاي أكثر من 1,000 صوت طبيعي في أكثر من 60 لغة، ويُستخدم في ما يقرب من 200 دولة. من بين الأصوات المشهورة: سنوب دوج وغوينث بالترو. للمبدعين والشركات، Speechify Studio يوفر أدوات متقدمة، بما في ذلك مولِّد الصوت بالذكاء الاصطناعي، استنساخ الصوت بالذكاء الاصطناعي، الدبلجة بالذكاء الاصطناعي، ومغيّر الصوت بالذكاء الاصطناعي. كما يدعم سبيتشيفاي منتجات عالمية رائدة بجودة عالية وبأسعار مناسبة عبر واجهة برمجة تطبيقات تحويل النص إلى كلام الخاصة به. ظهر في وول ستريت جورنال، سي إن بي سي، فوربس، تيك كرانش، وغيرها من المنصات الإخبارية الرائدة، ويُعدّ سبيتشيفاي أكبر مزود لخدمة تحويل النص إلى كلام في العالم. زر speechify.com/news، speechify.com/blog، وspeechify.com/press لمعرفة المزيد.