36 תשובות
מגניב
לא מוזר, אבל די מגניב
זה מגניב
לא מוזר
תרבותי לא גנטי
מדהים
אנונימי
נו תנסי עליי
שואל השאלה:
יכול להיות שקשור לתרבות, לא פוסלת, וroy אני צריכה ממש לנהל כמה שיחות עם הבן אדם אחד על אחד למשל בהתכתבות, או אם בסטיפס, לקרוא תשובה מאוד ארוכה שלו שתוכל לכסות נדבך מילולי שלם כדי לזהות
אנונימית
כל הכבוד! נשמע אחלה של כישרון! יחודי ומיוחד מאוד, אני מזהה לפי שם שם משפחה ותווים אבל את זה כולם יודעים לזהות וגם לא תמיד אני מצליחה ככה שהכישרון שלך יותר מגניב.
היי שלום קוראים לי אדם, חשוב לציין שכמעט אף פעם לא יוצא לי לאכול מסטיקים, ואני גם מאוד אוהב יזמות ופרודקטיביות. בכל אופן למיטב זכרוני אף פעם לא שמתי את החלב לפני הקרונפלקס, אה וגם אני אוהב מתמטיקה

גוי או יהודי? :)
לא מוזר בכלל
זה ממש הגיוני
את יכולה לפרט על ההבדלים ששמת לב אליהם?
אנונימי
שואל השאלה:
adams אני חושבת שאתה יהודי
אנונימית
שואל השאלה:
אבל זה לא מספיק ארוך כדי לזהות בטוח
אנונימית
שואל השאלה:
דוגמה אחת, יהודים כותבים את הא-ב' (כל 22 האותיות) בפרקי זמן קצרים מאוד בוריאציות של משפטים, זה קופץ לעין יותר מהר מאשר אצל גויים שמפיצים את הא-ב' במשפטים בסדר מפוזר ולא אחיד.. לגויים יש גם ניסוח מתנגן וקופצני ואצל יהודים יש סוג של מדרגות נוטות לירידה כלפי אותיות דומות עם פיסוק קשוח....קצת מסובך להסביר במילים איך זה עובד, את צריכה לראות דוגמה מוחשית מול העיניים כדי לצבור ניסיון ולהשוות מה ההבדל..^
אנונימית
פרופסור משה קופל פיתח אלגוריתם זהה, כזה האומר לנו מין, שפת אם, ותכונות אישיות של הכותב על סמך ניתוח סטטיסטי של טקסטים שכתב. אני יכול להאמין שעם ניסיון של שנים כבר הצלחת לפתח יכולת אבחנה אחת, אך כבר אמר אריסטו שהחוכמה נתונה לא לבעלי הניסיון כי אם לבעלי התאוריה, מפני שהראשונים רק יודעים שהדבר הוא כך ולא אחרת, ואילו האחרונים יודעים מדוע הוא כך.
שואל השאלה:
מזכיר לי מאוד גרפולוגיה^ אז זה לא נראה כל כך יחודי רק לו. וברור שעם הרבה טקסטים שבן אדם כותב תוכל ללמוד דברים על האישיות שלו, כי שם הוא בטח משתף על עצמו או בכל מקרה מעביר מידע על עצמו בדרך כזו או אחרת מרומזת בתוכן, אבל מצד שני מה תבין מטקסט יבש של בן אדם שכולו כתוב על פיזיקה ולא על עצמו או דעתו? מניחה שלא הרבה..
אגב מגניב אז אולי זיהיתי אינטואטיבית את התיאוריה כי גם אני יודעת להבדיל בין בנים לבנות, בכתב דפוס. כי אם זה בכתב יד, זה לא נחשב לדעתי. זה קל..
אנונימית
^האלגוריתם של קופל לא מתייחס לתוכן הדברים, רק לסגנון הכתיבה (הם הפעילו אותו על שייקספיר, על התנ"ך, מכתבי אדמו"רים, ועוד כמה).
את האמת שמתי לב שאני פונה בלשון זכר או נקבה לשאלות שלא צוין מה מין הכותב
שואל השאלה:
אבל סגנון הכתיבה הזה לא קצת מיושן?^
אנונימית
שואל השאלה:
וזה קצת לא חוכמה כי ברור שמכתבי אדמורים ותנך זכרים כתבו, נקבות לא יכתבו
אנונימית
^^זה לא משנה. האלגוריתם עובד בצורה הבאה: הוא לוקח טקסט אחד שלך, טקסט שני שלך, מוצא דפוסי כתיבה משותפים לשני הטקסטים (למשל: אצל נשים נמצא שימוש גבוה יותר בכינויי גוף כמו 'אני', 'הוא', וכד'), מוציא עיקרון כללי, ומיישם לטקסט שלישי לדעת האם הוא שלך או לא. כמובן, ככל שיש יותר טקסטים שנבדקו ע"י האלגוריתם כך הזיהוי הבא יהיה טוב ואמין יותר.

^הם לא בדקו את מכתבי האדמו"רים כדי לדעת האם כתב אותם בן או בת, הבדיקה היא כדי לראות האם, למשל, האדמו"ר הזקן כתב דבר מה שיוחס לו. ובאשר לתנ"ך הבדיקה הייתה בכדי לראות האם את חמשת החומשים כתב אותו אדם, או האם דפוסי השיח של אלוהים בתנ"ך הם זכריים או נקביים, ועוד כל מיני אבחנות כאלו.
שואל השאלה:
אוקיי. פחות מזדהה עם ההרגשה של לכתוב הרבה "אני",אולי אתה מתכוון לאוגדים, (הוא,היא,זה) תכלס יש משהו בדבריך. נשמע מעניין
אנונימית
^שימי לב שבתשובות שלך, ובנוסח השאלה המקורי, יש הרבה יותר יחס רפלקטיבי מאשר בתשובות של גברים פה (עברתי זריז על כמה מהפרחים). לא שזה שובניסטי או משהו, אפיסטמולוגיית העמדה למשל תטען שזה מכיוון שהגברים נמצאים "בעמדת כוח".
שואל השאלה:
את התגובה האחרונה שכתבת לא הצלחתי להבין...
מה זה רפלקטיבי ואיך קישרת לסגנון שלי שוביניסטיות או עמדת כוח?
והשאלה היא האם הסטטיסטיקות של משה קופל מתייחסות לחזרה של מילים בטקסט, למבנים מגובשים שחוזרים על עצמם תדיר ולאותם מאפיינים בין סגנונות כמו שאמרת, היא/הם/אני וכו'... ככה אפשר לזהות ממש בקלות גם בלי אלגוריתם. והיום יש אלגוריתמי עריכה ספרותיים דומים שמאפשרים לשים טקסט ולבדוק בשנייה מה אורך המשפט, המילים, כמה מילים חוזרות על עצמן, מה אורך המשפטים, אם התכוונת לאלגוריתם כזה.
מה שאף אלגוריתם לא יכול לבדוק (מתוחכם ככל שיהיה) הוא התחביר.
זה האתגר האמיתי. אני בעיקר מנסה לחפש את זה. מכונה אולי יכולה לתפוס כמות או מילים עם אופי שרירותי ובכך לשרטט סגנון אבל לא יכולה להבחין בין "לא לנגב במגבת" (מושא) לבין "לא לנגב במגבת" (תיאור אופן) כי רק מוח אנושי מסוגל להבחין בהקשר המקורי לפרטי פרטים. אם תגדיר מגבת כאובייקט "מושא" בתוכנה, בכל מקרה בהקשר אחר תפקידה התחבירי לא יהיה רלוונטי.
אפילו הצעתי לאקדמיה ללשון להרכיב מנגנון דומה ובתגובה ענו שזה בלתי אפשרי. עכשיו, מניסיוני זה הקושי האמיתי. יש הבדלים ברורים בין סגנון תחבירי של נשים וגברים, כולל יהודים גויים,כולל בין תרבויות, ואני במקור מדברת על שיטה כזו, שאין ביכולתה של הטכנולוגיה עדיין להמציא כי היא דורשת רישום כל הוריאציות של כל המשפטים בעולם מלכתחילה עם תוצאות משובלנות מראש. דבר שאינו מציאותי או אפשרי בעליל.
אנונימית
^לגבי ההתחלה, עזבי.
לגבי השאלה, האלגוריתם של קופל עובד על בינה מלאכותית, כלומר יש יכולת למידת דקויות עצמאית שמשווה את תוצאות עצמה לעצמה, ומשתפרת. אם נכניס שני טקסטים שלך המבנה שהאלגוריתם יזהה יהיה כללי וגס מאוד, אבל אם נכניס לעיבוד הראשוני כ1,000,000 טקסטים שלך, למשל, אז זה יבין את המבנה שלך עד לרמת השימושים הפונמים ודקות השימוש בכל אות.

בכדי לנתח שימוש תחבירי בשפה לא זקוקים כלל לכל המשפטים האפשריים בשפה, שכן האחרונים הם בכמות אינסופית (ורקורסיה של משפטי השפה היא אחת הראיות של חומסקי לתורת הדקדוק האוניברסלית), המבנה הדקדוקי קודם לשימוש הפרטי בשפה, הוא לא מופשט ממנה.
שואל השאלה:
אז הבנתי שרפלקטיביות היא חזרה או השתקפות של משפט/צליל קודם, נכון? לא לקחתי את זה בקטע שוביניסטי בכלל, להיפך, בחוקי ספרות רפלקטיביות היא מצרך נדיר לכתיבת סיפורת ואחת הדרישות הכי קשות לסופרים, (תכונה שמזוהה יותר אצל נשים וחסרה אצל סופרים גברים) מחמיא לי לדעת, תודה, ובמקרה אני כותבת :)
אנונימית
שואל השאלה:
זהו שלא דיברתי על פונולוגיה..או דקות השימוש באותיות ופונמות. אלא למיקום ולהקשר ולאיך שמרכיבים וממקמים מילים/בוחרים מילים, זה יותר קשור לסדר המילים במשפט, סדר הפיסוק במשפט, שטף הזרימה ועוד..
אנונימית
^זה המבנה, את זה הוא מזהה. ובהצלחה בכתיבה!
שואל השאלה:
אוקיי, הבנתי, מגניב. אבל רק כדי לוודא אם אנחנו על אותו גל ואולי זו סתם אי הבנה כשלמעשה אנחנו מסכימים על אותם דברים, אצרף לך דוגמה:
"הילדים חזרו מן הטיול מרוצים"
"הילדים המרוצים חזרו מן הטיול"

המשפט מאוד דומה והחליפו רק במיקום של המילה "מרוצים", הנשוא והתיאור גם השתנו אחריו. האם האלגוריתם יודע לזהות הבדלים מינוריים כאלה שמשנים את כל תבנית המשפט?
הוא יכול להבדיל בין התפקיד התחבירי של "מרוצים" לבין "המרוצים"? באשר למשמעות שנשארה מקורית המיקום של התפקיד התחבירי והגדרתו השתנה לחלוטין ..


ועוד יותר מעניין, האלגוריתם מסוגל לנתח פסוקיות?
מסוגל לנתח דו משמעות? חלקים כוללים? שגיאות בתקינות תחבירית לפי הכללים? מסוגל להבדיל בין סוגי הפסוקיות וסוגי הפתיחה שלהם? קשרים לוגים? תרשימי "קיטול, הקטלה, קטילה, וכו"?

והאם אחד מהמשפטים לא תקני? (רמז, כן)
"את הספר אתמול קנה דוד"
"את הספר אתמול דוד קנה"

השאלה אם האלגוריתם יעמוד על השגיאה או יתעלם ממנה ויחשיב אותה כנתון סטטיסטי שההבדל היחיד בו הוא המבנה/המיקום של קנה ודוד...

הוא מסוגל לנחש מהי הטעות במשפט הזה למרות שהכל תקין דקדוקית/תחבירית?

"התלמידים ביקשו מהמורים לצאת לטיול"

את השגיאה במשפט הזה למשל אי אפשר לזהות בשום תוכנה.

ובכללי איזה נושאים בלשון שלא תרצה, הכל קשור אחד לשני, ובמיוחד להקשר..ועכשיו לקושי תוסיף גם איך כל הדברים האלה באים לידי ביטוי בצורה שונה אצל גברים ונשים ומי עושה יותר טעויות..איזה סטטיסטיקת שימוש נפוצה במין אחד יותר מהאחר וכו'
אנונימית
שואל השאלה:
ותודה :) אגב הדיון ממש מעשיר ומעניין גם אם לא סגרנו כלום היה כיף לדבר:)
אנונימית
^^נראה לי פספסת את תכלית האלגוריתם.. הוא נועד רק לזהות ולשייך מאפיינים ומבנים משותפים בטקסטים, לא למצוא טעויות דקדוק או לנתח משמעות של משפט.
שואל השאלה:
אבל מושא, לוואי, תמורה, נושא, נשוא, וכל זה.. לא מבנים? זה מה שהטקסט בנוי עליו ברמה הכי מופשטת. כאילו, אם תכתוב משפט יש סיכוי שהמבנה יופיע בעוד מקומות אבל מה עם המשותף, היסודות של המבנה? זאת הייתה הכוונה שלי. כי שם תמצא את השוני והגיוון (למשל נשים נוטות להוסיף יותר לוואי אחרי שמות עצם, גברים משתמשים לרוב בצורת הבינוני- צורת ההווה, ועוד)
אצלך כגבר למשל צורת הבינוני בולטת-
"האלגוריתם של קופל **עובד** על בינה מלאכותית, כלומר יש יכולת למידת דקויות עצמאית ש**משווה* את תוצאות עצמה לעצמה, ו**משתפרת**.
אנונימית
שואל השאלה:
מקווה שהבנת
אנונימית
^^לא ידוע לי על ניסיון של האלגוריתם בזיהוי שגיאות כתיב (על אף שאם מישהו כותב עם שגיאות האלגוריתם ככל הנראה מתייק אותן לסוג כתיבה מסויים). וכן, לכן הזכרתי קודם לכן את אפיסטמולוגיית העמדה בתאוריה הפמיניסטית של הגל השני כלפי הלשון והמדע.