Category Archives: העולם האקדמי

הג'ובים הכי גרועים במדע

המגזין "מדע פופולרי" פרסם סיכום חביב ומקורי של המשרות הכי פחות נחשקות בתחום המחקר המדעי. אלה חלק מהמשרות שאותן המגזין מצא לנכון לדרג כגרועות ביותר:

1. חוקר עלוקות: לא רק שעלוקות הן מהיצורים הפחות חביבים שאפשר לחשוב עליהם, כאשר פוגשים את היצור הזה בסביבתו הטבעית הוא אפילו עוד פחות נחמד, וגם המנוסה מפניו הופכת להיות משימה קשה עד בלתי אפשרית. חוקרי עלוקות נוהגים לרדוף את אובייקט המחקר שלהם בביצות של יערות הגשם, מדרום אמריקה, דרך תאילנד ועד מגדסקר. בחום ובלחות  מתישים הם צריכים להתפלש בביצות תוך שהם אוספים אל הגוף שלהם מאות עלוקות, אותן הם צריכים להסיר בעזרת הציפורניים יחד עם כל מה שהעלוקה כבר הספיקה לתפוס. למרות העבודה הקשה והסיכון שהם לוקחים על עצמם, התהילה שמצפה למדעני העלוקות עבור מחקר מוצלח היא לא מהמובחרות ביותר. העולם המדעי לא ממש נרעש מגילוי של זן חדש של עלוקה, או ממיפוי התפריט המועדף על כל אחת מהעלוקות.

2. פיסיקאי תאורטיקן: בניגוד לתחום העלוקות, הפיסיקה התאורטית דווקא מבטיחה תהילת עולם למי שיצליח להראות פריצת דרך בעלת משמעות. הרי המדענים הפורסמים ביותר בהיסטוריה כדוגמת איינשטיין ובוהר (ובמידה מסויימת גם ניוטון) הם תאורטיקנים. אבל במציאות חייו של התאורטיקן הם זוהרים הרבה פחות. כספי המחקר המופנים לטובת פיסיקה תיאורטית הם מוגבלים, וגופים מממנים לא יוצאים מגדרם בשביל לממן מחקרים מסוג זה. מכיוון שהוכחת התאוריות היא קשה מאוד תיאורטיקנים מתקשים גם לפרסם מאמרים, ומוצאים את עצמם בעבודה מאומצת ומפרכת אך לא תמיד מתגמלת.

3. צייד הוריקנים: מסתבר שכדי לעקוב אחרי סופת הוריקן לא מספיק להשתמש בלוויין, אלא צריך למדוד את הלחץ האטמוספרי בתוך עין ההוריקן. למשימה הזאת ארוך ומוכן צוות מיוחד, אשר טס לתוך ההוריקן ומטיל פנימה את מכשירי המדידה. במשך כ-12 שעות חג המטוס סביב ההוריקן וממשיך לבצע מדידות, עד שהוא חוזר לבסיס כשהוא חבול ומוכה. לפעמים המטוס חוזר במצב כל כך גרוע שהוא נשלח אחרי הטיסה הישר אל מגרש הגרוטאות. כמו שניתן לנחש, העבודה הזאת משלבת אלמנט לא מבוטל של סיכון. עד היום 36 אנשים לא הצליחו לחזור מהמשימה.

4. סייר מאובנים: דמותו של מחפש המאובנים מוכרת בציבור כשהוא בפוזה של התבוננות רבת משמעות במאובן של דינוזאור אקזוטי אשר מחציתו חשופה ומחציתו השניה עדיין שקועה בקרקע, ובזהירות רבה מנקה את המאובן ומחלץ אותו ממנוחתו בת עשרות מיליוני השנים. אבל כמו שהקומיקאי האמריקאי גארי שנדלינג תמה על כך שהטלוויזיה מגיעה לכל סדרה בדיוק כשהדברים המעניינים קורים בה, כך גם סרטי הטבע מגיעים אל מחפשי המאובנים בדיוק ברגע שהם מוצאים מאובן מעניין. את רוב זמנם מעבירים מחפשי המאובנים במציאות פחות מסעירה, כשהם חופרים לשווא באופן סיזיפי רק בשביל לגלות אדמה ריקה או מאובן של יונק בן זמננו, תוך שהם לנים בשטח בתנאים קשים ומתעמתים עם מזג האוויר או טיפוסים שאינם תמיד מסבירי פנים.

5. תברואן של פסולת רפואית: כאן באמת אין צורך להסביר. השמדת שאריות מניתוחים או חלקי גוף שנפלטים מתהליכים רפואיים אחרים היא עבודה לא נעימה, וגם לא במיוחד בריאה.

6. סימולטור של מסע למאדים: אם את המסע לירח לא הוציאו לפני שביצעו סימולציה, אין שום סיבה שמסע מסובך ויקר הרבה יותר לא יזכה לאותו שירות. הבעיה היא שהמסע לירח ארך כמה עשרות שעות, ואילו המסע למאדים נמשך כמה מאות ימים. הניסוי הזה יתחיל בקרוב באחד ממתקני החלל ליד מוסקבה, וששת המשתתפים בו ישארו בתוך קפסולה זהה לזו שתישא את האסטרונאוטים למאדים למשך 520 ימים. במשך כל אותו זמן הם לא יורשו לצאת מהקפסולה, וייאלצו לאכול מזון קפוא ייבש ולשתות שתן ממוחזר. שמונה עשרה מצלמות יעקבו אחרי ששת "הנוסעים" במשך כל התקופה וינתחו כל תנועה שלהם במה שהיה יכול להיות תוכנית ריאליטי מהסוג המעוות ביותר. הפרס למתנדבים לניסוי יהיה שאחרי 250 ימים בקפסולה, שלושה מהם יוכלו לצאת ולסייר במשך כחודש על קרקע "מאדימית" כשהם לבושים בחליפות חלל. ניסוי דומה שנערך לפני 10 שנים הסתיים בקרב אגרופים, תלונה על הטרדה מינית, ונטישה צורמת לאחר קצת יותר מ-100 ימים.

כנסים מדעיים חשאיים

לפני מספר ימים קיבלתי מכתב הזמנה להשתתף בכנס מדעי כלשהו. בין שאר הנושאים הפרוצדורליים שפורטו במכתב כגון הכנת המצגת, סדר הדוברים וסידורי הלינה, היה גם סעיף של הסכם סודיות. על פי סעיף זה, כל המשתתפים בכנס צריכים לאשר את הסכמתם לכך שהם לא יעשו שום שימוש פומבי בנתונים ובמידע שהם נחשפו אליו במסגרת ההרצאות של הכנס.

מדענים ממספר תחומים בוודאי היו מגיבים למכתב כזה, הדורס ברגל גסה את הרוח האקדמית, בתחושת חלחלה המלווה בזעזוע עמוק. למרבה הצער, במסגרת האתיקה הקלוקלת (יחסית לתחומים אחרים) שהשתרשה בתחום מדעי החיים הליך מסוג זה איננו בלתי מתקבל על הדעת. ההיגיון העומד מאחורי ההליך הוא לעודד את משתתפי הכנס לשתף את עמיתיהם במידע, וכן להצהיר על כך שההרצאות של הדוברים האחרים יהיו מעניינות ומועילות יותר שכן הללו לא יחששו לחלוק במידע העדכני ביותר שלהם בפני קהל שומעיהם.

למרות ההיגיון המסויים (אם כי מעוות משהו) שיש בכך, לא נראה שמדען ששמע פריט מידע שיכול לשמש למחקר שלו יכול לבצע פעולה של מחיקת הזיכרון לאחר שהיה נוכח בהרצאה, ולא להשתמש באותו מידע למרות שהוא יכול לסייע לו. בנוסף, בהחלט ייתכן ששני מדענים עובדים בדיוק על אותו נושא, והסכם כזה עלול לגרום לכך שהגעתם לכנס תמנע מהם מלעשות שימוש בעבודה שהם כבר ביצעו רק מישום שמדען אחר עובד באותו זמן בדיוק על אותו מחקר.

אבל הנקודה העיקרית כאן, לדעתי, היא שלא ברור איך הסכם כזה יכול להשתלב ברוח האקדמית הדוגלת בשיתוף במידע ובסיוע הדדי של מדענים שונים הפועלים למען מטרה משותפת. הרי מטרתו הבלעדית של כנס מדעי היא לאפשר לכל מדען לשתף את עמיתיו במידע בכדי שיוכלו לנצל אותו לטובתם ולקדם הלאה את המדע בדרך לתגליות חדשות. נראה שהמארגנים של כמה כנסים בתחום מדעי החיים שכחו זאת לחלוטין, והחליטו שמטרת הכנס היא לא לשתף את הקהילה המדעית במחקר, אלא להאדיר את שמו של הדובר ולתת לו את האפשרות להפגין את חוכמתו בפני קהל השומעים. הרי אם קהל המדענים לא יכול לעשות שימוש הדדי במידע שנמסר להם במסגרת ההרצאות, הכנס נשאר ללא מטרה מלבד סיפוק יצר המציצנות של איש אל מעבדתו של רעהו.

אם לא די בכך, חלק מהכנסים במדעי החיים אפילו לא מתביישים לשאול בשלב הגשת המאמר אם הכותב הוא חוקר ראשי, ואם לא מי החוקר הראשי שהוא עובד איתו. השאלות כמובן חסרות כל רלוונטיות לעבודה שנעשתה, אבל נשאלות מטעמים מטופשים ובלתי מדעיים בעליל של יוקרה. מבחינה זו אולי היה רצוי לתחום מדעי החיים הוותיק לאמץ גישה פופולרית מאוד בתחום צעיר ממנו בהרבה כגון מדעי המחשב. בכנסים (ומספר לא קטן של כתבי עת) במדעי המחשב מגישים הכותבים גירסה של המאמר אשר אינה כוללת את שמות הכותבים, ורק לאחר שהוא מתקבל נמסרת גירסה סופית הכוללת גם את השמות. המטרה היא שהשופטים לא יושפעו מהמוניטין של הכותב, אלא ישפטו את העבודה בצורה האובייקטיבית ביותר ועל סמך איכותה בלבד. כמובן שבמקרים רבים ניתן לנחש את שמות הכותבים על פי תוכן המאמר, אבל הנושא העיקרוני הוא החשוב כאן. במדעי החיים גישה כזאת היא בלתי נתפשת, שכן בניגוד לגישה של מדעי המחשב נראה ששמות הכותבים הם למעשה הדבר החשוב ביותר במאמר, לפעמים מעבר לתוכן עצמו.

איך (לא) לכתוב מאמר מדעי

כתיבת מאמר מדעי היא ברוב המקרים משימה מרגיזה ובלתי מהנה שבה מדען או קבוצת מדענים צריכה לסכם ממצאים ועבודה של כמה חודשים, ולפעמים אפילו כמה שנים, במסמך של בערך 10 עמודים. אופיה הבלתי מרגש של המשימה, ולעיתים קרובות גם היעדר יכולת ניסוח מינימלית, בדרך כלל מביאים למצב שבו המדענים שעבדו על המחקר מעדיפים להתעלם מהנושא ולחכות שמישהו יואיל וייקח על עצמו את המשימה, רק כדי ששבועיים לאחר מכן יוכל צוות המחקר להתכנס לישיבה מיוחדת שבה יוכלו כולם יחד לנזוף בכותב על כך שהמאמר לא משקף את המחקר שנעשה. מכאן נכנסים למצב של עיכוב של עוד כמה חודשים עד להכנת נוסח חדש, שוב מכנסים דיון, ומכאן יכולות לעבור גם שנים עד שהמאמר מוגש לפרסום, אם בכלל. אבל מכיוון שמאמרים הם מטבע המסחר האקדמי, אף מדען לא יכול להרשות להפסיק לפרסם, ולכן בכל זאת מומלץ להתמודד עם הבעיה ולבצע את הפעולה הבלתי מהנה של כתיבת מאמר.

על מנת לעמוד בקריטריונים של פרסום (כלומר, לעבור את העורכים ואת השיפוט המדעי) המאמר צריך לעמוד בשלושה קריטריונים עיקריים: הוא צריך להיות נכון ומדוייק מבחינה מדעית, הוא צריך להוות חידוש על הידע שכבר קיים, והממצאים שבו צריכים להיות מעניינים וחשובים עבור האנשים שעוסקים בתחום. אחד הכללים הבלתי רישמיים הוא שצריך שיהיה ניתן לקרוא את המאמר ולהבין מה כתוב בו, אך מכלל זה נהוג בדרך כלל להתעלם.

מכיוון שהמשימה כל כך חשובה, הדרך הטובה ביותר ללמוד אותה היא לבדוק מה עשו מדענים אחרים שכן הצליחו להעביר את המאמרים שלהם בשלום. דוגמא אחת שאפשר ללמוד ממנה היא מאמר שפורסם בכתב העת Science, אחת משתי ספינות הדגל של כתבי העת האקדמיים. המשמעות של פרסום מאמר בכתב עת זה היא ברורה לכל איש אקדמיה, וכל מדען, מוערך ומפורסם ככל שיהיה, תמיד ישאף לפרסם בו. מכיוון שהמאמר פורסם בכתב עת יוקרתי כל כך, ניתן להשתמש בו ככלי עזר הדרכתי לכתיבת מאמרים.

כותרת המאמר היא: 100%Accuracy in Automatic Face Recognition המכריזה נצחון על אחת הבעיות היותר חשובות בתחום הראיה הממוחשבת בפרט ומדעי המחשב בכלל, והיא זיהוי פנים אוטומטי. הכותרת מרעידת אמות הסיפים אכן הוכיחה את עצמה כיעילה מאוד בכדי לעבור את צוות העורכים הבררני של Science, אולם יצר בלתי נשלט לקריאה של תוכן המאמר מגלה ש "100 אחוז" הושגו רק בניסוי אחד, ותוך שימוש בבסיס נתונים קטן באופן דרמטי של 25 אנשים (בזמן שמחקרים מקבילים משתמשים בבסיס נתונים של מעל 1000).  העובדה שבמחקר נכללו 25 אנשים היא למעשה מניחה את הדעת, שכן באותה מידה יכלו החוקרים לבצע את הניסוי עם אדם אחד, ולדווח על 100 אחוזי דיוק אם הזיהוי היה במקרה יוצא נכון. בחירת הכותרת מדגימה כלל ידוע בכתיבת מאמרים מדעיים, והוא שהכותרת חייבת להיות "מפוצצת", גם אם המסר המשתמע ממנה אינו עולה בקנה אחד עם תוכן המאמר.

עוד משתמע מהכותרת שזיהוי הפנים נעשה בצורה אוטומטית, אבל ניסיון להבין את השיטה לעומק מלמד שבתהליך מעורב שלב ידני ועתיר עבודה של התאמת התמונות, אשר אינו יכול להתבצע בצורה אוטומטית בטכנולוגיה הקיימת כיום. חלקו של השלב הידני בתהליך אינו מתואר במאמר, אלא ניתן להגיע אליו רק כאשר קוראים (בזהירות רבה) את החומר הנוסף (supplementary material) אשר לא נמצא בז'ורנל עצמו אלא רק באתר האינטרנט של כתב העת. המסקנה, אם כך, היא תמיד לשים את המידע שמחליש את המאמר כחומר נוסף. צעד זה יבטיח להוריד למינימום את הסיכון שמישהו אי פעם יקרא את אותם חלקים של המחקר שהחוקר פחות גאה בהם.

המשך קריאה של המאמר מביא לניסוי נוסף שהתבצע בעזרת בסיס נתונים שונה מעט, שהוביל לתוצאות צנועות הרבה יותר של 80 אחוזי דיוק (20 מתוך 25). העובדה שתוצאות אלה אינן משתקפות בכותרת מרעישת העולמות (המכריזה על "100 אחוז") היא דוגמא ליישום יעיל של החוק השלישי בכתיבת מאמר מדעי: תמיד תדווח על התוצאות שתומכות בהנחת המחקר, ותשתמש רק בנתונים שמספקים את התוצאות הטובות ביותר. יישום נכון של כלל זה תמיד ייאפשר לחוקרים לפרסם את התוצאות הרצויות, וכך יבטיחו את הצלחת המחקר.

כלל נוסף וחשוב בכתיבת מאמר מדעי הוא תמיד לוודא שלא ניתן לבצע רפליקציה של הניסוי. בהתאם לכלל זה, כותבי המאמר השתמשו בתמונות שהם אספו בעצמם מהאינטרנט (במקום באחד מבסיסי הנתונים הקיימים), וכן בתוכנת זיהוי פנים מסחרית שאינה קוד פתוח, וציבור המדענים אינו יכול לדעת כיצד היא פועלת. אולם מכיוון שקיים חשש סביר שמישהו יקנה את התוכנה וינסה לחזור על הניסוי, בחרו החוקרים לבצע את הניסוי שלהם באמצעות שירות אינטרנט של חברה מסחרית (My Heritage). אותה חברה אמנם טוענת שהיא משתמשת באותה תוכנת זיהוי, אך מדובר כמובן בסוד מסחרי בבעלות חברה פרטית, שאינה מחוייבת לכללי השקיפות המאפיינים את העולם המדעי. מיכוון שמדובר בממשק אינטרנטי, כמובן שלא ניתן לדעת בוודאות מה באמת קורה בצידו האחר של השרת.

באותו עניין, הניסוי המתואר ב-Science עונה גם על דרישה נוספת של כתיבת מאמר מדעי, והיא לעולם אל תחלוק את הנתונים שלך עם מדענים אחרים. בכדי לעמוד בדרישה זו, נמנעים החוקרים מלהשתמש באחד מבסיסי הנתונים הסטנדרטיים, אלא משתמשים בבסיס נתונים של חברה פרטית שאיש (פרט לעובדי אותה חברה) לא יודע מה טיבו ומה למעשה הוא כולל. החוקרים אף מגדילים וטוענים ש"אין להם שליטה על בסיס הנתונים". מכיוון ש-My Heritage מעדכנת את בסיס הנתונים שלה באופן תדיר, הניסוי שנערך על ידי החוקרים כבר לא יוכל להתבצע לעולם, אפילו לא על ידי החוקרים עצמם, שכן גם להם אין שליטה על הנתונים של My Heritage. בכך משתמשים החוקרים בצורה מבריקה בהגיגו של הרקליטוס לפיו "לא ניתן לחצות את אותו נהר פעמיים".

מלבד הכותרת, תמיד יש לעשות ניסיון לשבץ במאמר מספר גדול ככל הניתן של הכרזות מרעישות עולם. במאמר הנידון גם כלל זה מיושם בצורה יעילה, וניתן למצוא בו שלל הכרזות רבות משמעות. למשל, החוקרים קובעים שהשיטה שלהם משתווה לרמת זיהוי הפנים של הקוגניציה האנושית. למרבה הצער, המדענים בדקו את השיטה שלהם בעזרת 25 אנשים בלבד, ושכחו שהאדם הממוצע מסוגל לזהות אלפי אנשים ללא טעות.

בכדי להבין היטב את המנגנונים המתוארים בניסוי תמיד רצוי לשנות שני פרמטרים באותו ניסוי, על מנת שהקורא לא יוכל לדעת איזה מהפרמטרים השפיע על השינוי בתוצאות. עיקרון זה מיושם בצורה נאה במאמר בכך שהחוקרים משתמשים  בתמונות "ממוצעות" (ממוצע לכל פיקסל מבין אוסף התמונות של אותו אדם) במקום בתמונות רגילות, אבל בנוסף גם מפרידים את הרקע מהתמונה. על ידי ביצוע שני השינויים באותו ניסוי מבטיחים הכותבים שהקורא לא יוכל לדעת אם הזיהוי המדוייק הוא תוצאה של התמונות הממוצעות, או שאולי מדובר בהסרת מפגעי הרקע של התמונות.

 לבסוף, מדע איכותי תמיד צריך שיהיה לו יישום מעשי. כפי שמציעים הכותבים בתבונה, היישום המעשי המתבקש לתגלית המרעישה הוא כמובן אימות של כרטיסי זיהוי (עם תמונה). אולם מטרת כרטיס הזיהוי היא לאפשר לאדם להוכיח שהוא אכן בעליו החוקיים של הכרטיס תוך שכנוע הסובבים אותו שהתמונה המופיעה בו היא אכן תמונתו שלו. מכיוון שמרבית האנשים לא מסוגלים להבדיל בין התמונה "הממוצעת" של ביל קלינטון שמוצגת במאמר לבין הדודה של עצמם, קיים ספק עם תעודות הזיהוי המצויידות בתמונות החדשות אכן יעמדו במשימה. כלומר, גם אם כרטיס הזיהוי יזוהה על ידי מערכת אוטומטית כלשהי, לא תהיה שום דרך לוודא שהאדם המחזיק בו הוא אכן האיש המופיע בתמונה, מה שפותח פתח רחב לזיופים, הונאות ומעשי התחזות. בנוסף לכך, הכותבים מציינים ששימוש בתגלית החדשה שלהם ידרוש החלפה של כל מסמכי הזיהוי הקיימים במסמכים עליהם תופיע תמונה "ממוצעת" במקום תמונה רגילה. את התהליך של החלפת מאות מיליוני מסמכים במסמכים בעלי תמונות ממוצעות מסכמים החוקרים בשתי מילים-  "Technically Straightforward".

 

 

[*** זו הגירסה של המכתב באנגלית. נוסח מקוצר ומתון הרבה יותר פורסם ב-Science. ***]

 

How (not) to Write a Scientific Paper

Lior Shamir

In the paper "100% accuracy in automatic face recognition” published in the journal “Science” (Vol. 319, p. 435, 2008), two researchers from the University of Glasgow propose a new computer vision method of automatic face recognition that can “elevate machine performance to the standard of familiar face recognition in humans”. The authors propose to simply average several face images of each person, and advertise that the resulting averaged image can be recognized with no error. Since this work was published in arguably the flagship scientific journal, it can effectively be used as an educational resource that demonstrates how scientific research should be conducted and reported.

First, it is common truth that the first rule of scientific writing is to always give an earth-shattering title to your manuscript. The title "100% accuracy in automatic face recognition", which declares victory on one of the most burning problems in machine vision, is definitely appealing enough to get the paper through the editorial board of "Science". This by itself is an indication of the efficacy of the title. However, an unexplained passion of reading the fine print reveals that 100% accuracy was achieved by using just 25 face images (while standard face recognition datasets include more than 1000 subjects). This finding is indeed a relief, as one could suspect that technically valid 100% accuracy could have been reported by testing just one face image, if that image happened to be recognized correctly.

The title also uses the term "automatic face recognition". However, an attempt to obtain deep understanding of the proposed method leads to the unfortunate understanding that the "automatic" recognition is actually based on a highly labor-intensive step of image registration, using a method that cannot be automated with the currently available technology. The presence of this step is not mentioned in the manuscript, and the reader is exposed to it only if she cares to read the supplementary material. The conclusion is, therefore: describe all pieces of information that weaken the paper only in the on-line supplementary material. This measure will surely minimize the chances of anyone seeing those part of your research that you are less proud of.

Further reading of the manuscript leads to another experiment, in which a subset of the original data was used. These data are perfectly valid in terms of the input of the proposed method, but achieve only 80% accuracy (20 images out of 25 were recognized correctly). These results, however, are not reflected in the title, which trumpets "100% accuracy". This demonstrates a good practice of rule number three of scientific writing – report only on the results that best support your hypothesis, and use only the data that give you the desired performance. This is a highly important practice in conducting scientific research, as proper implementation of this rule allows researchers to customize their reported results to a desirable level.

Another basic rule that must be kept in mind when reporting on a scientific experiment is always make sure that the experiment is unreplicable. Following the proper procedure of conducting scientific research, the authors use a commercial face recognition software, which operates in a fashion that is uncertain to the public. Being aware of the risk that someone might purchase the same version of the commercial software and repeat the experiment, the authors do not use the software themselves. Instead, they use an on-line service provided by another commercial company that claims it uses the software developed by the former company. By doing this, the authors not only dismiss themselves from any responsibility of knowing how the face images are actually being recognized, but also brilliantly make the experiment unrepeatable, as the commercial company providing the on-line service ("My Heritage”, Ltd.) modifies its data and software regularly. Potential hazardous transparency of the way the face recognition is performed is protected by the fact that commercial companies often become unfriendly to strangers demanding to review their intellectual properties and commercial secrets.

In the same matter, the experiment described in "Science" also follows the complementary rule of never share your data. In order to meet this requirement, the authors avoid reporting their experimental results using one of the numerous publicly available face datasets. Instead, they use a celebrity image dataset owned by a commercial company, which consists of thousands of images that cannot be downloaded in one piece. The authors claim in the paper that they "have no control" of these data. Since the dataset is highly dynamic, by the time someone tries to repeat the experiment it can be reasonably assumed that the data will be different from what they were when the reported experiment was performed. This is a remarkable practical use of Confucius's theory according which "we can never step into the same river twice”.

Except from an epochal title, a proper scientific report should also include several earth shaking statements in the body of the manuscript. The authors definitely follow this rule by stating that their face recognition method can "elevate machine performance to the standard of familiar face recognition in humans". Regretfully, the authors tested their systems using 25 subjects, and did not take into account that the average human can recognize with no error many times more faces. They also fashionably ignore the second reported experiment, which shows 80% accuracy in face recognition.

In order to achieve deep understanding of the mechanism being studied, it is advised to always change two parameters in a single experiment, so that it will be uncertain which parameter actually affected the results. This principle is nicely implemented by averaging the face images, but also segmenting the faces form the image background. Applying these two image processing elements in the same experiment verifies that the reader is not able to determine whether the recognition accuracy changed due to the image averaging, or perhaps resulted from the controlled segmentation of the faces and their separation from the noisy background.

Finally, good science must always have a practical application. The natural application of this research is to use it for verifying photo identification cards, as the authors wisely propose in the paper. However, an important purpose of the photo in the ID is to allow its owner to easily convince that the person in the photo is actually them. Since most people would probably find it difficult to distinguish between the averaged Bill Clinton’s photo presented in the paper and their own auntie, the averaged image will doubtfully satisfy this requirement. The authors also note that practical implementation of their method requires changing the photos in all photo IDs, and replacing them with averaged face photos. The project of changing the photos in hundreds of millions of documents and replacing them with “averaged” images is summarized by the authors in two words – “technically straightforward”. Even Douglas Adams could not have written it better.

מי הליצן שמנהל את מקדונלדס?

מה תפקידו האמיתי של רונלד מקדונלד? במאמר שהתפרסם בכתב העת The Leadership Quarterly, טוענים שני חוקרים מאונ' ניו מקסיקו סטייט והאוניברסיטה הטכנולוגית של סידני שתפקידו של הליצן רונלד מקדונלד אינו מסתכם בהיותו סמל שיווקי של תאגיד המזון. החוקרים, דוויד בואי וקארל רודס, מסבירים שרונלד הוא למעשה נושא מישרה בהנהלה הבכירה של התאגיד.

 

למרות שליצנים בדרך כלל לא מחזיקים במשרות בכירות בארגונים אליהם הם שייכים, בואי ורודס מסבירים שהחל משנת 2003 משמש רונלד כמנהל האושר הראשי של התאגיד (CHO – Chief Happiness Officer), והאמונה של ההנהלה הבכירה ביכולותיו של הליצן אף הביאה למינויו ב-2004 לתפקיד לנציג הארגון לסגנון חיים בריא.

 

למרות שרונלד הוא מעשה בריאתם של חברי הנהלת ענק המזון המהיר, טענת המחקר היא שדמותו של רונלד היא בעלת תפקיד מנהיגותי בפני עצמה, והדומיננטיות שלה מתבטאת במיוחד בתהליך המעבר שעוברת החברה במטרה לנער מעצמה את תדמית המזון עתיר השומן, ולהחליפה בתדמית בריאה יותר ודלת קלוריות. מכיוון שהשניים אינם מצליחים לסווג את המנהיגות של רונלד להגדרה קיימת, טוענים החוקרים שמנהיגותו של רונלד מקדונלד היא סוג חדש של מנהיגות המצריכה הגדרה פורמלית בפני עצמה.

 

 

למאמר המלא:

 

David M. Boje and Carl Rhodes, The leadership of Ronald McDonald: Double narration and stylistic lines of transformation, The Leadership Quarterly, Vol. 17, No. 1, pp. 94-103, 2006.

מבט מקרוב על שיטות הסחת הדעת של חברות התרופות

מידת האמינות של מאמרים מדעיים המתארים ניסויים קליניים בתרופות הוא נושא מוכר ושנוי במחלוקת, והספקנים שביננו נוהגים לציין את נוכחותם השלילית של האינטרסים הכלכליים שכותבי המאמרים נאלצים להתייחס אליהם.

 

אבל מאמר שפורסם על ידי קבוצת חוקרים מאונ' ייל בכתב העת הרפואי המכובד Journal of the American Medical Association  חושף מציאות עגומה הרבה יותר, ומטיל צל כבד על מה שבעצם קורה ב"שוק" פרסום הניסויים הקליניים. אמנם דיווחים על ביצועיהן של תרופות מסויימות מתבררים לעיתים כבלתי מדוייקים, אבל מה שחושפים החוקרים מייל הוא תהליך שיטתי ומתוכנן של קידום תרופות דרך מאמרים המתפרסמים בכתבי עת מדעיים.

 

במרכז המחקר נמצאת התרופה רופקוקסיב, אשר שווקה בשם המסחרי ויוקס. תרופה זו עמדה במבחנים קליניים אשר הראו כי התרופה ראוייה לשימוש ואושרה על ידי מנהל התרופות והמזון האמריקאי (FDA), אולם בסוף 2004 הורדה מין המדפים לאחר שנמצא קשר בין שימוש בתרופה לבין סיכון מוגבר להתקף לב ולשבץ מוחי, מה שהוביל לסדרת תביעות ענק נגד היצרנית, ענקית התרופות מרק (Merck).

 

בעיקבות התביעות שהוגשו נגדה ובהוראת בית המשפט, חשפה חברת מרק את המסמכים הקשורים לפיתוח ושיווק התרופה. הנגישות לחומר החקירה איפשרה לצוות מאונ' ייל לנבור במיליוני המסמכים, לבדוק את שיטות העבודה של החברה ולהשוות בין מסמכים שנכתבו על ידי עובדי מרק לבין פרסומים בכתבי עת מדעיים שנכתבו לכאורה על ידי אנשי אקדמיה.

 

התוצאות מלמדות על תבנית שיטתית ומתוכננת היטב לפיה עובדי חברת מרק ביצעו את הניסויים וכתבו את המאמרים שמתארים אותם, אבל לאחר השלמת העבודה גייסו אנשי אקדמיה אשר יסכימו לפרסם את המאמר בשמם. החוקרים של ייל מצאו מספר רב של מאמרים שבמקור הופיעו עליהם שמות של עובדי מרק, אך התפרסמו בכתבי העת תחת רשימת שמות שונה מהרשימה המקורית. רשימת הכותבים של המאמרים שהתפרסמו אמנם כללה את שמות עובדי מרק, אבל בדרך כלל שמם נסוג לאחור ברשימת הכותבים, כשאת המקומות הראשונים תופסים אנשי אקדמיה אשר שמם לא הופיע כלל על המאמר המקורי. התמורה עבור השימוש בשמם של הכותבים נעה בין 750 ל-2500 דולר. עוד מתברר שחלק מהמאמרים כלל לא נכתבו על ידי עובדי מרק, אלא הוזמנו על ידי אנשי השיווק של מרק מחברות המתמחות בכתיבת מאמרים. מאמרים אלה נכתבו על ידי כותבי צללים, אך נחתמו בשמם של עובדי מרק ואנשי אקדמיה. יחד עם זאת יש לציין שלא כל אנשי האקדמיה אליהם פנתה החברה נאותו לקיים את שיתוף הפעולה או לקבל את התמורה הכספית.

 

הגשת מאמר העוסק בניסוי קליני דורש גילוי נאות של כותבי המאמר באשר למקורות המימון של המחקר. בדיקה של המאמרים הרלוונטיים העוסקים בניסויים קליניים הראתה שב-92 אחוז מהמקרים נרשמו הבהרות מתאימות המציינות שהמחקר מומן על ידי חברת מרק. למרות שמידת הדיווח היחידה המתקבלת על הדעת היא 100%, אפשר להתייחס לממצא זה כחמור באופן מתון. אולם בדיקה של מאמרי סקירה חשפה תמונה שונה לחלוטין, כאשר למעלה מ-70 אחוז מהמאמרים שהתפרסמו לא דיווחו כנדרש על כך שהמחקר מומן על ידי מרק. בנוסף לכך, רוב מכריע של מאמרי הסקירה נכתבו תחת שם אחד בלבד של איש אקדמיה, מה שמחק למעשה לחלוטין את העיקבות לענקית התרופות.

 

אמנם המחקר התמקד בתרופה אחת בלבד שמיוצרת על ידי חברה אחת, אבל שיטת הפעולה של חברת מרק מטילה כתם על הניסויים הקליניים המתפרסמים בכתבי העת הרפואיים.

.

  

למאמר המלא:

Joseph S. Ross, Kevin P. Hill, David S. Egilman, Harlan M. Krumholz,, 2008, Guest Authorship and Ghostwriting in Publications Related to Rofecoxib, Journal of the American Medical Association, 299, p. 1800-1812.

תורת הגזע של ג'יימס ווטסון

המדען ג'יימס ווטסון ידוע בעיקר בזכות עבודתו החלוצית בתחום הגנטיקה, ובפרט הודות לתגלית מולקולת הד.נ.א, אשר אף זיכתה אותו בפרס נובל (בנסיבות שהן במקרה הטוב שנויות במחלוקת). אבל פרט לתגליות המדעיות שלו, ווטסון גם ידע להגיע לכותרות בעזרת התבטאויותיו השערורייתיות, אשר פורשו באופן מעליב כלפי נשים, הומוסקסואלים, אנשים הסובלים מעודף משקל, ועוד. אבל האמירה אשר יצרה את המהומה התקשורתית המשמעותית ביותר היתה ככל הנראה הביקורת שהשמיע כלפי מדיניות הסיוע של המערב למדינות אפריקה, בה טען שמדיניות זו מבוססת על ההנחה השגויה, לדעתו, לפיה האינטיליגנציה של השחורים היא שקולה לאינטיליגנציה של האדם הלבן.  למרות שמדענים בכירים מיהרו לגנות את הדברים (רבים מהם מכירים מקרוב את אישיותו הבעייתית, ולא הופתעו מכך), דבריו של ווטסון מיקמו את עצמם בציבורים מסויימים כאמת שאסור לומר אותה, או כעובדה מדעית אשר אסור לציין ברבים מסיבות של פוליטיקלי קורקטיות.

מכיוון שכל אמירה של ג'יימס ווטסון מתקשרת באופן כמעט אוטומטי לגנטיקה, חשוב לציין שההבדלה מבחינה גנטית בין אנשים שחורים ללבנים היא הבדלה שרירותית למדי, ואינה משקפת הבדלים גנטיים מהותיים. האמירה שקיימים הבדלים גנטיים מסויימים בין שחורים ללבנים היא אמנם נכונה עובדתית, אבל חוטאת לאמת שכן הבדלים גנטיים משמעותיים באותה מידה קיימים בין כל אדם לכל אדם אחר. למעשה, ניתן למצוא אנשים באפריקה אשר שייכים לאותו שבט, וההבדלים הגנטיים בינהם יהיו רבים יותר מאשר ההבדלים בין כל אחד מהם לבין אדם אירופאי. אבחנה זו תואמת את הממצאים המראים שהמין האנושי התפתח ביבשת אפריקה. לכן, לעובדה שהגזעים ניקבעו על פי צבע העור אין משמעות גנטית מהותית באופן מיוחד, והסיבה לכך היא פשוט שצבע העור הוא דבר שקל מאוד לזהותו. כלומר, בזמן שקשה למדוד תכונות כגון טוב הלב או רמת האינטיליגנציה, את צבע העור ניתן לאבחן במבט חפוז. לכן דווקא אינדיקטור זה הפך למבדיל עיקרי בין בני האדם, למרות שמשמעותו מבחינה גנטית מסתמנת כמתונה למדי.

אבל הנתון עליו מבסס ווטסון את התאוריה שלו הוא מבחן האינטיליגנציה (IQ), שבהקשר אליו הוא טוען שההישגים של תושבי מדינות אפריקה נמוכים באופן משמעותי מהישגיהם של תושבי המדינות המתועשות. גם טענה זו נכונה מבחינה עובדתית, אך אינה קשורה לתאוריה שבה היא אמורה לתמוך. כידוע, מבחני ה-IQ הם יחסיים, והתוצאה מנורמלת כך שהאדם הממוצע יהיה בעל רמת אינטיליגנציה של בדיוק 100. אבל אם בודקים את המספרים הגולמיים שלפני הנירמול, אפשר לראות בבירור שרמת האינטיליגנציה הכללית עלתה במקומות מסויימים בעשרות אחוזים במשך תקופה של כמה עשרות שנים. לא ברור מה מקור העליה הזאת, אבל התקופה הקצרה מלמדת שאין שום סיכוי שהתשובה לכך נמצאת בגנום האנושי. אמנם לא ידוע מה בדיוק מודד מבחן ה IQ, אבל מה שברור הוא שהוא לא מודד את האינטיליגנציה המולדת, ולכן אינו מהווה אינדיקציה ברת השוואה בין אנשים מתרבויות שונות.

מדענים מאונ' הרווארד חושפים – תרבות של שתיית אלכוהול מגבירה את הצריכה של משקאות אלכוהוליים

במחקר שהתפרסם לאחרונה חושפים מדענים מאונ' הרווארד את אבחנתם לפיה צריכת האלכוהול היא גבוהה יותר בקמפוסים בהם הסטודנטים נוהגים לשתות יותר אלכוהול. המחקר נמשך כ-14 שנים וכלל כ-50,000 סטודנטים מלמעלה מ-100 אוניברסיטאות שונות בארצות הברית. באופן מפתיע, החוקרים חושפים קשר ברור בין התמכרות לאלכוהול להתנהגות אלימה, הפרעות בלימודים ולציונים נמוכים יותר. עוד ממצא מהפכני הוא שסטודנטים שנוהגים לבלות במסיבות צורכים באופן ממוצע כמויות אלכוהול גבוהות יותר מאלה שמוותרים על בילויים מסוג זה. מסקנה מפתיעה נוספת היא שבקמפוסים בהם מוטל איסור על שתיית אלכוהול צריכת האלכוהול נמוכה יותר מאשר בקמפוסים המתירים שתייה בתחומם.

את המחקר הוביל הנרי ווכסלר מהמחלקה לבריאות הציבור של אונ' הרווארד, ואליו הצטרף טובין נלסון מאונ' מינסוטה.

למאמר המלא:

Wechsler H, Nelson TF; What We Have Learned From the Harvard School of Public Health College Alcohol Study: Focusing Attention on College Student Alcohol Consumption and the Environmental Conditions That Promote It, Journal of Studies on Alcohol and Drugs, 2008; 69(4): 481-490.

אזהרה לציבור – מחקר חדש קובע שאכילת אש מזיקה לבריאות

רעידת אדמה בעולם המחקר הרפואי. מחקר חדש ומהפכני שהתפרסם לאחרונה בכתב העת הרפואי המכובד “Australasian Radiology" קובע באופן חד משמעי שאכילת אש עלולה לפגוע בבריאות. את המחקר החשוב ערכו ד"ר מייקל גואנדליני וד"ר קארין סטיינק מבית החולים המחקרי של אוניברסיטת קוויסלנד, אוסטרליה.

במחקר השתתף אובייקט אחד (כנראה שקצת קשה למצוא אוכלי אש), שנבדק פעם אחת בלבד כשעתיים לאחר מופע אכילת אש. הממצאים המדאיגים שהתגלו כוללים קוצר נשימה, המופטיסיס (שיעול או יריקה של דם), עליה בחום הגוף וכאבי שרירים. סריקת CT אף העלתה חשש לנמק, הצטברות נוזלים בצדר (הקרום העוטף את הריאות), בריחת אוויר מחלל הריאה, וכן חשש לזיהום באיזור בית החזה.

החוקרים מסכמים את המאמר בקריאה לציבור לגלות אחריות ולהמנע מאכילת אש. למי שנסיבותיו האישיות אינן מאפשרות לנהוג בהתאם, ממליצים החוקרים להבדק לעיתים קרובות ולבצע מעקב יסודי אחר כל התפתחות בלתי שגרתית באיזור חלל בית החזה.

למאמר המלא:

Guandalini, M, and Steinke, K., 2007, “Fire-eating: Hazards of hydrocarbon aspiration” Australasian Radiology, vol. 51, p. 567–569

האיש שכותב 10 ספרים בשעה

נא להכיר פיליפ מ. פארקר. ד"ר פרקר הוא מרצה במכון INSEAD רב התהילה שבצרפת, אבל בזמנו הפנוי הוא גם כותב ספרים. מהזה כותב? מרביץ אותהשאילתה  באתר AMAZON מראה שעד היום (בצהריים) הספיק פרקר לפרסם לא פחות מ 85,894 ספרים. בין השאר הוא כתב מעל 700 ספרים על מכוניות, 3000 ספרים על חרקים, 150 ספרים על מסחר אלקטרוני, 70 ספרים על סנדוויצ'ים ו 1500 ספרים על משקאות אלכוהוליים.

הנה כמה דוגמאות לכותרות ספרים מאת פיליפ פרקר:

The 2007-2012 Outlook for Lemon-Flavored Bottled Water in Japan

 

The 2007-2012 World Outlook for Metal Household Medicine Cabinets

 

The 2002 Official Patient's Sourcebook on Muscular Dystrophy

 

Water Reuse in Brazil: A Strategic Reference, 2006

 

The World Market for Textile Tarpaulins, Awnings, Sunblinds, Tents, Boat Sails, and Camping Goods: A 2007 Global Trade Perspective

Running the Voodoo Down: The Electric Music of Miles Davis

 

וכאמור, הרשימה עוד ארוכה.

אז איך הוא עושה את זה? ד”ר פרקר פיתח תוכנה לכתיבת ספרים. התוכנה מחפשת באינטרנט ובמאגרי מידע שונים, מלקטת את המידע הדרוש, ומקבצת את הנתונים לספר. בכל כמה דקות מייצר בית החרושת הזה ספר חדש.

 

 

פיליפ מ. פארקר בויקיפדיה


 

נמצאה ראייה ראשונה לנכונות "תאורמת הקוף"

אי-מייל שרשרת אנונימי הפנה את תשומת ליבי לראייה הראשונה התומכת באופן אמפירי בנכונותה של תאורמת הקוף (Infinite Monkey Theorem). על פי התאורמה, אם ישב קוף לפני מכונת כתיבה למשך זמן אינסופי ויקיש על הקלידים בצורה אקראית, בסופו של דבר הוא ידפיס ללא טעויות את הכרזת העצמאות (לא חשוב של איזו מדינה). הסיכוי שקוף שאינו יודע קרוא וכתוב ידפיס דבר בעל תוכן הוא אמנם כמעט אפסי, אבל חשוב לזכור שעומד לרשותו משך זמן אינסופי להשלמת המלאכה. לכן, אחרי רצף כמעט אינסופי של מחרוזות תווים אקראיות, יתקבל לבסוף רצף אותיות שתוכנו זהה לזה של הכרזת העצמאות.

 

למרות ההגיון הפשוט העומד מאחורי התאוריה, היא מעולם לא הוכחה בצורה אמפירית, וזאת מטעמים מובנים שאין צורך לפרט. אבל תפנית משמעותית בחקר התאורמה נרשמה בחודש מאי 2007, אז התפרסם המאמר "Determination of dopant of ceria system by density functional theory", בכתב העת המכובד "Journal of Materials Science". המאמר אמנם עוסק בנושא שונה לגמרי, אבל הקשר שלו לתאורמת הקוף עובר דרך מאמר אחר שהתפרסם שנה קודם לכן בכתב העת המכובד אף יותר PNAS תחת הכותרת "Optimization of ionic conductivity in doped ceria". המשותף לשני המאמרים הוא – הכל. כלומר, למעט הכותרת, שני המאמרים זהים לחלוטין. כל משפט, כל מילה וכל אות זהים בשני המאמרים באופן מוחלט. אפילו התמונות והגרפים נראים בדיוק אותו הדבר. מכיוון שעל כל מאמר חתומה קבוצת חוקרים שונה, ההסבר היחיד לתופעה הוא שמתוך מספר אינוספי של מאמרים אקדמיים שנכתבים על ידי קבוצות שונות, שניים מהם לבסוף יהיו זהים לחלוטין. אין ספק שהממצא החדש מדגים באופן ברור את נכונותה של תאורמת הקוף.