1. זיהוי
גבולות בין יחידות משמעות בדיבור
הפרויקט עוסק
באחד ההיבטים בתחום "הבנת דיבור". המשימה הראשונה בהבנת דיבור היא זיהוי
של גבולות בין מבני שיח המעודנים יותר - פעולות דיבור (Speech Acts). בשפה מדוברת לא תמיד מסיימים את המשפטים וכן יש
השמטות רבות (ellipsis). Speech act הוא חלק משפט או מספר
משפטים המביעים כוונה. לדוגמא:
- אין לי דוגמא,
ואני לא מתכוון לתת לך.
- בוא הנה,
- נדמה לי
ש-...
- לא, לא נראה
לי.
- אתה בא להירשם
לפרויקט?
תיאור
הפרויקט:
בפרויקט
תידרשו לכתוב תוכנה עם:
- קלט אימון: אוסף קבצי דיבור.
- לכל קובץ דיבור יהיה טקסט שבו מופיעות
נקודות זמן, בהן ישנו גבול בין משפטים או Speech Acts. לכל נקודת זמן יצורף
תג המציין:
- סיווג הנקודה: האם הנקודה מפרידה בין משפטים או בין Speech Acts בתוך משפט.
- קלט בדיקה: קובץ דיבור.
- פלט של שלב הערכה: קובץ טקסט שבו מופיעות
נקודות זמן, בהן ישנו גבול בין משפטים או Speech Acts. לכל נקודת זמן התוכנית
תצרף שני תגים:
- סיווג הנקודה: האם הנקודה מפרידה בין משפטים או בין Speech Acts בתוך משפט.
- רמת הביטחון: מספר בין 0 ל- 1
המציין רמת הביטחון של התוכנה בהחלטתה.