1. الصفحة الرئيسية
  2. واجهة برمجة التطبيقات (API)
  3. واجهة OpenAI Whisper المستضافة

واجهة برمجة تطبيقات Whisper من OpenAI المستضافة: دليل شامل

Cliff Weitzman

كليف وايتزمان

الرئيس التنفيذي ومؤسس Speechify

يوفر Speechify API زمن استجابة يبلغ 300 مللي ثانية، وأصواتًا بجودة بشرية، مع دعمٍ لأكثر من 50 لغة

apple logoجائزة آبل للتصميم 2025
أكثر من 50 مليون مستخدم

لمحة عن OpenAI Whisper

نموذج Whisper هو نظام مفتوح المصدر للتعرّف التلقائي على الكلام (ASR) طوّرته OpenAI. صُمّم للتعامل مع طيف واسع من مهام تحويل الكلام إلى نص، بما في ذلك تفريغ الحلقات الصوتية، تحويل الحوارات المنطوقة إلى نص مكتوب، وحتى ترجمة الكلام. وبفضل تدريبه على مجموعة بيانات متنوّعة، يدعم لغات عدة، مع أداء لافت خصوصًا باللغة الإنجليزية.

الميزات الرئيسية لواجهة Whisper

  1. دقة عالية: يحقّق Whisper معدل خطأ منخفض في الكلمات (WER)، بفضل التدريب المكثّف على طيف واسع من الملفات الصوتية.
  2. دعم متعدد اللغات: مع أنه مُحسَّن للإنجليزية، تدعم الواجهة لغات متعددة، ما يجعلها مرنة للتطبيقات العالمية.
  3. تفريغ في الوقت الفعلي: مع دعم وحدات GPU، لا سيما من NVIDIA، يمكن للواجهة تفريغ الصوت في الوقت الفعلي، وهو مناسب جدًا لتطبيقات مثل البث المباشر.
  4. مرونة في تنسيقات الصوت: بوسع الواجهة التعامل مع تنسيقات صوتية متعددة، بما في ذلك WAV و WEBM.

إعداد واجهة Whisper

لتبدأ مع Whisper، يكفي غالبًا تثبيت الحزمة عبر pip:

```bash

pip install openai-whisper

```

ما إن تنتهي من التثبيت، يصبح استخدام Whisper في سكربت بايثون بسيطًا. إليك مثالًا سريعًا لتفريغ ملف WAV:

```python

import whisper

model = whisper.load_model("base") # أو اختر حجم نموذج آخر حسب احتياجاتك

result = model.transcribe("path_to_your_audio_file.wav")

print(result['text'])

```

سيقوم هذا السكربت بتحميل نموذج Whisper وتفريغ ملف الصوت وطباعة النص المُفرَّغ. كما يوفّر الطوابع الزمنية وبيانات وصفية أخرى في ناتج JSON، والتي قد تكون مفيدة جدًا لتحليلٍ مفصّل.

تسعير Whisper وخيارات الاستضافة

يمكن استضافة واجهة Whisper بأكثر من طريقة:

  1. الاستضافة الذاتية: يمكنك استضافة Whisper على خوادمك الخاصة. يفيد ذلك إذا كانت لديك هواجس تتعلّق بخصوصية البيانات أو إذا كنت تحتاج إلى تفريغ كميات كبيرة من الملفات الصوتية بانتظام. يتطلّب هذا إعدادًا وإدارةً أكثر، لكنه يتيح تحكّمًا كاملًا في بيئة التفريغ.
  2. خدمات السحابة: يمكنك نشر Whisper على منصات سحابية مثل Azure. غالبًا ما يُبسّط ذلك عملية الإعداد ويوفّر موارد قابلة للتوسّع حسب الطلب.

لا تتقاضى OpenAI حاليًا رسومًا لاستخدام Whisper مباشرةً لأنه مفتوح المصدر، لكن ضع في الحسبان تكاليف الخوادم أو خدمات السحابة، ولا سيما إذا كنت تحتاج إلى وحدات معالجة رسومية (GPUs) للتفريغ في الوقت الفعلي.

حالات الاستخدام

مجالات استخدام واجهة Whisper كثيرة ومتنوّعة:

  1. المنصات التعليمية: تفريغ المحاضرات والدروس لتسهيل الوصول.
  2. القطاعان القانوني والطبي: تفريغ دقيق للإجراءات والاستشارات.
  3. وسائل الإعلام والترفيه: ترجمة ونصوص مصاحبة للمحتوى للجمهور العالمي.
  4. البودكاست والمقابلات: تحويل الكلام إلى نص قابل للبحث بسهولة.

توسعة واجهة Whisper API

لمن يرغبون في ضبط نموذج Whisper لاحتياجات محددة، يُعد كونه مفتوح المصدر ميزة كبيرة. يمكنك تدريب النموذج على مجموعات بيانات معينة لتحسين دقته في المفردات المتخصصة أو اللكنات. كما يمكن استخدام Docker لحزم بيئة Whisper ضمن حاويات، ما يسهّل نشرها على أنظمة مختلفة.

يُعد OpenAI Whisper API أداة قوية لكل من يحتاج إلى خدمات تحويل الكلام إلى نص بكفاءة ودقة. بفضل سهولة الاستخدام، ودعمه لعدة لغات، ومرونته في الاستضافة، يبرز Whisper كأحد الحلول الرائدة في مجال التعرف على الكلام. سواء للمشاريع الفردية أو لاحتياجات المؤسسات الكبيرة، يمكن لـ Whisper تلبية مجموعة واسعة من متطلبات التفريغ. لمزيد من الوثائق التفصيلية ودعم المجتمع، تفضّل بزيارة صفحة المشروع على GitHub عبر github.com/openai/whisper.

مع استمرار تقدم التكنولوجيا، من المتوقع أن تلعب أدوات مثل Whisper API دورًا محوريًا في كيفية تفاعلنا مع المعلومات المنطوقة ومعالجتها. اطلع على الوثائق، جرّب الكود، واستكشف كيف يمكن أن يُحسّن Whisper مشاريعك أو سير عملك.

الأسئلة الشائعة

يمكنك استضافة Whisper على خوادمك الخاصة أو نشره على منصات سحابية مثل Azure، مع توفير التبعيات اللازمة والتأكد من توافقه مع احتياجاتك.

نعم، Whisper مفتوح المصدر ويمكن استخدامه مجانًا، لكن استضافته على خوادمك أو منصات سحابية قد يتطلب تكاليف.

على الرغم من أن OpenAI طوّرت Whisper، فإنها لا تستضيف نقاط نهاية Whisper API بشكل مباشر. يجب على المستخدمين استضافة النموذج بأنفسهم أو استخدام خدمات سحابية.

قد تكون لنماذج Whisper قيود تتعلق بدقة اللغات خارج الإنجليزية، والاعتماد على GPU للمعالجة في الوقت الحقيقي، والتقيّد بشروط OpenAI، لا سيما فيما يخص استخدام مفتاح OpenAI API للخدمات ذات الصلة مثل ChatGPT أو نماذج اللغة الكبيرة مثل GPT-3.5 وGPT-4.

احصل على أصوات Speechify المحبوبة من خلال واجهة برمجة تطبيقات سريعة، قابلة للتوسّع، وملائمة للمطورين

احصل على وصول إلى API
api access banner

شارك هذا المقال

Cliff Weitzman

كليف وايتزمان

الرئيس التنفيذي ومؤسس Speechify

كليف وايتزمان مدافع عن ذوي عسر القراءة والرئيس التنفيذي ومؤسس تطبيق Speechify، أفضل تطبيق لتحويل النص إلى كلام في العالم، إذ نال أكثر من 100,000 تقييم بخمس نجوم وتصدّر متجر التطبيقات ضمن فئة الأخبار والمجلات. في عام 2017، أدرجته فوربس ضمن قائمة 30 تحت 30 تقديراً لجهوده في جعل الإنترنت أكثر سهولة وصولاً لذوي صعوبات التعلّم. ظهر كليف وايتزمان في منصات مثل EdSurge وInc. وPC Mag وEntrepreneur وMashable، وغيرها من وسائل الإعلام الرائدة.

speechify logo

حول Speechify

قارئ النص إلى كلام رقم 1

Speechify هي المنصة الرائدة عالميًا في تحويل النص إلى كلام، يثق بها أكثر من 50 مليون مستخدم، ويدعمها أكثر من 500,000 تقييم بخمس نجوم عبر تطبيقاتها على iOS، Android، امتداد Chrome، تطبيق الويب، وتطبيقات سطح المكتب على Mac. في عام 2025، منحت شركة Apple Speechify جائزة Apple Design Award المرموقة في WWDC، ووصفتها بأنها "مورد حيوي يساعد الناس على عيش حياتهم." تقدّم Speechify أكثر من 1000 صوت طبيعي بأكثر من 60 لغة، وتُستخدم في قرابة 200 دولة. ومن بين الأصوات الشهيرة Snoop Dogg، Mr. Beast، وGwyneth Paltrow. للمبدعين والشركات، يوفّر Speechify Studio أدوات متقدمة، بما فيها AI Voice Generator، AI Voice Cloning، AI Dubbing، وAI Voice Changer. كما تزوّد Speechify أبرز المنتجات بواجهة برمجة تطبيقات لتحويل النص إلى كلام عالية الجودة وموفّرة للتكلفة text to speech API. وقد تناولتها The Wall Street Journal، CNBC، Forbes، TechCrunch، وغيرها من كبريات وسائل الإعلام، وتُعد Speechify أكبر مزوّد لتحويل النص إلى كلام في العالم. تفضّل بزيارة speechify.com/news، speechify.com/blog، وspeechify.com/press لمعرفة المزيد.