1
00:00:00,699 --> 00:00:06,659
מתי בפעם האחרונה שמעתם על בעיה במתמטיקה שאף אחד לא הצליח לשפר במשך חמישים ושש שנה?

2
00:00:07,420 --> 00:00:09,880
אני מדבר על תקופה שקדמה לנחיתה על הירח,

3
00:00:10,699 --> 00:00:12,649
עכשיו תדמיינו שבוקר אחד

4
00:00:13,260 --> 00:00:13,880
אתם קמים

5
00:00:14,100 --> 00:00:18,440
ומגלים שבינה מלאכותית של גוגל, כזו שעוד לא שמעתם עליה,

6
00:00:18,700 --> 00:00:19,290
פשוט

7
00:00:19,659 --> 00:00:20,420
עשתה את זה.

8
00:00:21,139 --> 00:00:23,299
זה בדיוק מה שקרה עם AlphaEvolve.

9
00:00:24,079 --> 00:00:26,149
הוא לקח בעיה קלאסית במדעי המחשב,

10
00:00:26,200 --> 00:00:27,309
הכפלת מטריצות,

11
00:00:27,520 --> 00:00:30,909
ושיפר אלגוריתם משנת אלף תשע מאות שישים ותשע

12
00:00:31,239 --> 00:00:33,189
של מתמטיקאי בשם שטראסן.

13
00:00:33,639 --> 00:00:37,590
הוא הוריד את מספר פעולות הכפל הנדרשות למטריצת ארבע על ארבע

14
00:00:38,400 --> 00:00:38,840
מורכבת מ-

15
00:00:39,119 --> 00:00:41,830
ארבעים ותשע לארבעים ושמונה.

16
00:00:42,439 --> 00:00:42,830
זה

17
00:00:42,959 --> 00:00:45,959
אולי נשמע כמו שיפור קטן, אבל בתחום הזה, שבו

18
00:00:45,959 --> 00:00:49,080
מוחות מבריקים שברו את הראש במשך יותר מחצי מאה,

19
00:00:49,799 --> 00:00:51,669
זה כמו לגלות יבשת חדשה.

20
00:00:52,520 --> 00:00:53,840
אז מה זה הקסם הזה?

21
00:00:53,959 --> 00:00:56,430
האם גוגל פשוט בנתה מתכנת-על?

22
00:00:56,849 --> 00:00:58,639
התשובה, כמו תמיד,

23
00:00:59,279 --> 00:01:02,799
הרבה יותר מעניינת. כי AlphaEvolve הוא לא מתכנת,

24
00:01:03,439 --> 00:01:04,800
הוא משהו אחר לגמרי.

25
00:01:05,629 --> 00:01:09,910
בפרק הקודם דיברנו על Claude Code ואיך הוא הופך מתכנתים למפקחים.

26
00:01:10,239 --> 00:01:13,239
AlphaEvolve הופך מתכנתים לגננים.

27
00:01:13,959 --> 00:01:15,160
הוא לא חושב על פתרון,

28
00:01:15,239 --> 00:01:16,190
הוא מגדל אותו.

29
00:01:17,139 --> 00:01:20,410
הכל מתחיל ונגמר בפונקציית התאמה (Fitness).

30
00:01:20,900 --> 00:01:23,580
זו לא התשובה, זה המדד להצלחה. זה כמו להגיד ל-AI:

31
00:01:24,779 --> 00:01:29,650
"אני לא יודע איך לנצח בשחמט, אבל אני כן יודע להגיד לך אם עשית שחמט.

32
00:01:30,019 --> 00:01:31,449
עכשיו לך תמצא את הדרך".

33
00:01:32,059 --> 00:01:32,269
אתה

34
00:01:32,379 --> 00:01:34,250
מגדיר את המטרה, למשל:

35
00:01:34,610 --> 00:01:37,849
"תכתוב לי קוד שממיין מספרים כמה שיותר מהר

36
00:01:38,040 --> 00:01:40,010
ובלי להשתמש ביותר מדי זיכרון",

37
00:01:40,500 --> 00:01:42,419
והמערכת כבר תמצא את הדרך.

38
00:01:43,160 --> 00:01:44,519
שינוי תפיסתי.

39
00:01:44,639 --> 00:01:45,510
גוגל אומרים:

40
00:01:45,800 --> 00:01:46,559
אל תממש,

41
00:01:46,639 --> 00:01:47,750
תן לי לפשפש.

42
00:01:48,660 --> 00:01:49,910
אז איך זה עובד בפועל?

43
00:01:50,059 --> 00:01:53,650
המערכת מתחילה עם "אוכלוסייה" של פתרונות קוד ראשוניים,

44
00:01:54,190 --> 00:01:55,650
שיכולים להיות די גרועים,

45
00:01:56,099 --> 00:01:58,620
ואז מתחיל תהליך של ברירה טבעית.

46
00:01:58,699 --> 00:02:01,059
כל פתרון נבדק מול פונקציית ההתאמה,

47
00:02:01,809 --> 00:02:04,449
המוצלחים שורדים וזוכים "להתרבות".

48
00:02:05,239 --> 00:02:06,250
מה זה אומר להתרבות?

49
00:02:06,290 --> 00:02:06,900
להתפתח,

50
00:02:07,089 --> 00:02:08,710
ולא סתם באופן אקראי,

51
00:02:08,729 --> 00:02:11,160
אלא באמצעות הצעות יצירתיות

52
00:02:11,570 --> 00:02:12,479
לשינוי

53
00:02:13,110 --> 00:02:16,960
שמגיעות ממודל שפה גדול, במקרה הזה Gemini של גוגל.

54
00:02:17,860 --> 00:02:21,839
לא בכל עציץ צריך להשקיע, מודל Gemini Flash יכול להציע

55
00:02:22,770 --> 00:02:24,139
הרבה רעיונות מהר,

56
00:02:24,589 --> 00:02:28,110
ו-Gemini Pro יצלול לעומק לשפר את הטובים שבהם.

57
00:02:29,300 --> 00:02:30,470
זה לא כזה חדש.

58
00:02:30,550 --> 00:02:32,899
גם מודלים קלאסיים ללמידת מכונה עוברים

59
00:02:33,029 --> 00:02:33,990
אימון חזרתי.

60
00:02:34,149 --> 00:02:36,360
פונקציית ההתאמה שלהם היא אחוז הטעות

61
00:02:36,839 --> 00:02:39,690
(כמה שונה התחזית שלהם מתוצאה היסטורית),

62
00:02:40,309 --> 00:02:43,000
אבל AlphaEvolve היא שילוב קטלני -

63
00:02:43,630 --> 00:02:46,770
תהליך מובנה של אלגוריתם אבולציוני

64
00:02:47,029 --> 00:02:49,440
עם יצירתיות של LLM מודרני.

65
00:02:50,190 --> 00:02:52,389
התהליך הזה הוא Cascading, מדורג.

66
00:02:52,910 --> 00:02:55,559
במקום להריץ בדיקה יקרה על כל רעיון גרוע

67
00:02:56,149 --> 00:02:57,800
שהמודל מנפיץ, יש שלב סינון ראשון,

68
00:02:57,910 --> 00:02:58,699
מהיר וזול.

69
00:02:59,600 --> 00:03:01,130
זה כמו בראיון עבודה:

70
00:03:01,179 --> 00:03:05,809
יש מבחן קצר בכניסה, אולי ב-Zoom, ורק מי שעובר אותו זוכה להיכנס

71
00:03:06,100 --> 00:03:08,080
לראיון עומק עם ראש הצוות.

72
00:03:08,699 --> 00:03:10,729
זה חוסך המון זמן ומשאבים.

73
00:03:12,300 --> 00:03:13,440
זה לא נייר אקדמי.

74
00:03:13,539 --> 00:03:17,050
גוגל משתמשת ב-AlphaEvolve כדי לשפר את לב התשתיות שלה.

75
00:03:17,699 --> 00:03:20,169
מערכת ניהול המשאבים של גוגל, Borg,

76
00:03:20,539 --> 00:03:21,910
הצליחה לחסוך אפס נקודה

77
00:03:22,460 --> 00:03:23,330
שבע אחוז

78
00:03:23,639 --> 00:03:25,830
מכוח המחשוב העולמי של גוגל.

79
00:03:26,669 --> 00:03:27,660
נשמע לכם מעט?

80
00:03:28,440 --> 00:03:32,690
בסדר גודל של גוגל, זה כמו למצוא מדינה קטנה של שרתים

81
00:03:33,000 --> 00:03:34,350
שלא ידעתם שקיימת.

82
00:03:35,309 --> 00:03:36,720
גם ב-Chip עצמו,

83
00:03:36,830 --> 00:03:38,699
AlphaEvolve הציע שינוי

84
00:03:39,070 --> 00:03:40,589
בדור הבא של שבבי ה-TPU,

85
00:03:41,910 --> 00:03:46,000
וכמובן בתוכנה - הכפלת מטריצות שהזכרתי בהתחלה.

86
00:03:47,000 --> 00:03:47,669
מה יפה?

87
00:03:48,740 --> 00:03:50,320
ה-AI הציג את ההמלצות שלו לא סתם,

88
00:03:50,399 --> 00:03:51,580
לא בניפנופי ידיים,

89
00:03:52,080 --> 00:03:53,119
אלא בהסברים

90
00:03:53,520 --> 00:03:56,580
שמדברים את השפה של מהנדסי התשתיות,

91
00:03:57,050 --> 00:03:58,229
אנשי החומרה

92
00:03:58,410 --> 00:03:59,350
והמתכנתים.

93
00:04:00,289 --> 00:04:01,110
מה עוד יפה?

94
00:04:01,720 --> 00:04:03,320
נוצר פה מעגל קסמים.

95
00:04:03,839 --> 00:04:04,880
Demis Hassabis,

96
00:04:04,960 --> 00:04:06,080
מנכ"ל DeepMind:

97
00:04:06,649 --> 00:04:08,050
"ידע מוליד עוד ידע,

98
00:04:08,130 --> 00:04:09,970
אלגוריתמים מייעלים אלגוריתמים אחרים.

99
00:04:10,449 --> 00:04:14,710
AlphaEvolve מייעל את המערכת האקולוגית של ה-AI שלנו,

100
00:04:15,100 --> 00:04:18,920
כך שגלגלי התנופה, הקידמה, מסתובבים מהר יותר".

101
00:04:20,500 --> 00:04:23,049
ה-AI משפר את היעילות של הכלים

102
00:04:23,299 --> 00:04:27,059
שמשמשים לבניית הדור הבא של ה-AI, שיהיה חזק יותר

103
00:04:27,339 --> 00:04:29,260
ויוכל לשפר את הכלים עוד יותר.

104
00:04:29,940 --> 00:04:31,859
זו כבר לא התקדמות לינארית,

105
00:04:31,940 --> 00:04:33,260
זו ריבית דריבית.

106
00:04:34,239 --> 00:04:39,429
ואיפה שיש פריצת דרך של תאגיד ענק, יש גם קהילת קוד פתוח נמרצת.

107
00:04:39,760 --> 00:04:41,890
תוך ימים ספורים מפרסום המאמר,

108
00:04:42,440 --> 00:04:45,440
צצו ברשת מימושים פתוחים כמו OpenEvolve.

109
00:04:45,959 --> 00:04:49,309
זה מראה כמה הקהילה רעבה לכלים כאלה, או כמה

110
00:04:49,480 --> 00:04:52,920
היא לא סומכת על גוגל שתשחרר את הכלים האמיתיים.

111
00:04:53,799 --> 00:04:54,559
סיימון פרידר,

112
00:04:54,600 --> 00:04:54,940
חוקר

113
00:04:55,630 --> 00:04:56,459
AI מאוקספורד:

114
00:04:57,160 --> 00:05:01,989
"ל-DeepMind יש היסטוריה קצת מפוקפקת בכל מה שקשור לשחרור קוד מלא.

115
00:05:02,519 --> 00:05:06,010
המאמר מדהים, אבל לפעמים הקוד שהם מספקים

116
00:05:06,359 --> 00:05:07,100
עם באגים".

117
00:05:07,880 --> 00:05:09,250
זה יוצר בעית אמון.

118
00:05:09,329 --> 00:05:12,880
אם AlphaEvolve פותר בעיה מתמטית

119
00:05:13,089 --> 00:05:15,119
מורכבת, והפתרון עצמו

120
00:05:15,649 --> 00:05:17,649
קשה לאימות על ידי בן אנוש,

121
00:05:18,130 --> 00:05:20,730
איך אנחנו יכולים להיות בטוחים שהוא צודק?

122
00:05:21,609 --> 00:05:22,369
ועוד ביקורת -

123
00:05:22,570 --> 00:05:25,440
הרבה אלגוריתמים מהירים יותר להכפלת מטריצות

124
00:05:25,570 --> 00:05:27,290
אינם יציבים מבחינה נומרית.

125
00:05:27,329 --> 00:05:27,720
כלומר,

126
00:05:27,970 --> 00:05:33,950
הם צוברים שגיאות עיגול קטנות שהופכות את התוצאה הסופית לחסרת משמעות בעולם האמיתי.

127
00:05:34,369 --> 00:05:36,559
האם AlphaEvolve לקח את זה בחשבון?

128
00:05:37,239 --> 00:05:40,500
האם היציבות הנומרית הייתה חלק מפונקציית ההתאמה שלו?

129
00:05:41,410 --> 00:05:43,209
המאמר לא מפרט, וזה

130
00:05:44,049 --> 00:05:46,899
דגל אדום מבחינת השימושיות של הפתרון.

131
00:05:48,459 --> 00:05:49,429
פושמיט קוהלי,

132
00:05:49,510 --> 00:05:51,820
ראש תחום AI למדע ב-DeepMind:

133
00:05:52,750 --> 00:05:58,059
"סוכן הקידוד העל-אנושי הזה מסוגל לקחת על עצמו משימות מסוימות

134
00:05:58,700 --> 00:06:00,359
ולהגיע הרבה מעבר למה

135
00:06:00,790 --> 00:06:03,079
שידוע מבחינת פתרונות עבורן".

136
00:06:04,070 --> 00:06:08,510
כנראה שבעתיד הלא רחוק, הכישרון הכי חשוב שלנו

137
00:06:08,790 --> 00:06:10,100
לא יהיה לכתוב קוד,

138
00:06:10,910 --> 00:06:13,779
אלא להגדיר בעיות בצורה כה מדויקת

139
00:06:14,149 --> 00:06:16,660
עם פונקציית התאמה כל כך טובה,

140
00:06:17,029 --> 00:06:19,519
שמערכת אבולוציונית כמו AlphaEvolve

141
00:06:20,070 --> 00:06:21,829
תוכל לפתור אותן עבורנו.

142
00:06:22,470 --> 00:06:23,040
אנחנו

143
00:06:23,149 --> 00:06:24,179
עוברים להיות

144
00:06:24,630 --> 00:06:27,380
מבנאים לאדריכלים של פתרונות.

145
00:06:28,279 --> 00:06:31,640
פעם, להיות מתכנת היה לדעת לדבר עם המחשב.

146
00:06:32,279 --> 00:06:32,920
מחר,

147
00:06:33,119 --> 00:06:34,829
זה יהיה לדעת לשאול

148
00:06:35,000 --> 00:06:36,190
את השאלות הנכונות.

149
00:06:37,320 --> 00:06:38,269
עד הפעם הבאה,

150
00:06:38,399 --> 00:06:40,640
תהיו טובים ותמשיכו להיות סקרנים.

151
00:06:41,200 --> 00:06:41,600
יאללה ביי.