האם יש כמה חלופות קוד פתוח למה ש- Wit.ai עושה, כלומר מיפוי שאילתות קול / טקסט לפעולות על ידי הגדרת דפוסי זיהוי?
(ל- Wit.ai יש ממשק API פתוח, אך קוד המקור סגור, מה שהופך אותו לבלתי הולם למטרות חינוך.)
האם יש כמה חלופות קוד פתוח למה ש- Wit.ai עושה, כלומר מיפוי שאילתות קול / טקסט לפעולות על ידי הגדרת דפוסי זיהוי?
(ל- Wit.ai יש ממשק API פתוח, אך קוד המקור סגור, מה שהופך אותו לבלתי הולם למטרות חינוך.)
Baidu Research פרסמה את אתמול את הקוד לספריית זיהוי הדיבור שלה באמצעות סיווג זמני זמני המיושם עם לפיד.
אמות מידה של Gigaom:
Snips.ai מהווה אלטרנטיבה כעת (2019). קוד פתוח ומכבד פרטיות. הקוד שלהם נמצא ב- github
הקונסולה שלהם כבר אינה קוד פתוח מכיוון שהיא נרכשה על ידי סונוס.
אין חלופות קוד פתוח. Kaldi היא ככל הנראה מערכת זיהוי הדיבור בקוד הפתוח הטובה ביותר, אך היא מוגדרת מאוד לא טריוויאלית (עדיין לא הצלחתי בה ממש). בעבר השתמשתי ב ספינקס, אך הוא באיכות נמוכה מאוד (חשוב שזיהוי הדיבור מתקופת 2000 - כלומר לפני שהיה טוב).
באשר לצד ה- NLP של דברים, מה שאני מכנה "הכרת כוונות", לא בדקתי את זה כל כך הרבה, אבל ה CoreNLP של סטנפורד עשוי להיות מקום טוב להתחיל בו. שוב אני מצפה שזה יהיה לא מאוד טריוויאלי.
ישנן שתי חלופות קוד סגור דומות - Nuance Mix ו- Houndify, אבל נכון כעת (פברואר 2016), שניהם בטא סגורים למעשה (Houndify עדיין לא מאפשרת לכם ליצור פקודות מותאמות אישית, ו- Nuance לא פתחה את ה- HTTP API שלהם, אם כי תוכלו לגשת אליו דרך Android או iOS).