שְׁאֵלָה:
חלופה קוד פתוח ל- Wit.ai
smihael
2015-09-24 18:19:23 UTC
view on stackexchange narkive permalink

האם יש כמה חלופות קוד פתוח למה ש- Wit.ai עושה, כלומר מיפוי שאילתות קול / טקסט לפעולות על ידי הגדרת דפוסי זיהוי?

(ל- Wit.ai יש ממשק API פתוח, אך קוד המקור סגור, מה שהופך אותו לבלתי הולם למטרות חינוך.)

האם זה אנגלית בלבד?
עד כמה שידוע לי, wit.ai היא אנגלית בלבד, אבל לא הייתי ממשיך לחשוב אם האלטרנטיבה הזו היא רב לשונית. או בשפה אחרת כלשהי (רצוי בכתב לטימי לשם רדיואליות); אם הגישה לבעיה היא הסתברותית, היא לא ממש אכזרית אם היא אנגלית או לא - זה אמור להיות קל מספיק בכדי לשנות חלק מהפרמטרים, נדיר יותר מאשר לכתוב מחדש לוגיקה עד לסמנטיקה של שפה מסוימת.
שְׁלוֹשָׁה תשובות:
Franck Dernoncourt
2016-01-18 23:43:28 UTC
view on stackexchange narkive permalink

Baidu Research פרסמה את אתמול את הקוד לספריית זיהוי הדיבור שלה באמצעות סיווג זמני זמני המיושם עם לפיד.

אמות מידה של Gigaom:

enter image description here

מגניב מאוד, אבל CTC הוא רק חלק אחד ממערכת זיהוי דיבור. אתה צריך גם את שאר הרשת, וכמות עצומה של נתוני אימונים. Baidu השתמש 10k שעות של תמלול שמע, הושקע עד 100k שעות עם רעש.
@Timmmm נקודה טובה. כמה מצביעים נוספים: [תוכנת זיהוי דיבור הגונה עבור לינוקס] (http://unix.stackexchange.com/q/256138/16704)
Massagran
2019-08-08 23:53:52 UTC
view on stackexchange narkive permalink

Snips.ai מהווה אלטרנטיבה כעת (2019). קוד פתוח ומכבד פרטיות. הקוד שלהם נמצא ב- github

עריכה :

הקונסולה שלהם כבר אינה קוד פתוח מכיוון שהיא נרכשה על ידי סונוס.

זה שירת את המטרה שלי היטב, אבל הם החליטו לסגור את הגישה הציבורית למסוף המפתחים https://forum.snips.ai/t/important-message-regarding-the-snips-console/4145, מה שהופך אותה פחות שימושית כמו חלק חלקי מפתח בקוד היו מקור סגור.
Timmmm
2016-02-12 19:52:34 UTC
view on stackexchange narkive permalink

אין חלופות קוד פתוח. Kaldi היא ככל הנראה מערכת זיהוי הדיבור בקוד הפתוח הטובה ביותר, אך היא מוגדרת מאוד לא טריוויאלית (עדיין לא הצלחתי בה ממש). בעבר השתמשתי ב ספינקס, אך הוא באיכות נמוכה מאוד (חשוב שזיהוי הדיבור מתקופת 2000 - כלומר לפני שהיה טוב).

באשר לצד ה- NLP של דברים, מה שאני מכנה "הכרת כוונות", לא בדקתי את זה כל כך הרבה, אבל ה CoreNLP של סטנפורד עשוי להיות מקום טוב להתחיל בו. שוב אני מצפה שזה יהיה לא מאוד טריוויאלי.

ישנן שתי חלופות קוד סגור דומות - Nuance Mix ו- Houndify, אבל נכון כעת (פברואר 2016), שניהם בטא סגורים למעשה (Houndify עדיין לא מאפשרת לכם ליצור פקודות מותאמות אישית, ו- Nuance לא פתחה את ה- HTTP API שלהם, אם כי תוכלו לגשת אליו דרך Android או iOS).



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 3.0 עליו הוא מופץ.
Loading...