1
00:00:01,018 --> 00:00:06,480
קרה לכם פעם ששאלתם את הבוס שאלה של כן/לא, וקיבלתם בתגובה הרצאה של חצי שעה?

2
00:00:07,230 --> 00:00:09,920
זה מתיש, נכון? וגם יקר,

3
00:00:10,470 --> 00:00:14,329
במיוחד אם הבוס הזה הוא מודל AI שגובה תשלום לפי מילה.

4
00:00:15,220 --> 00:00:18,940
גוגל בעצמה מודה שמודלי חשיבה יכולים להיות יקרים פי 6

5
00:00:19,260 --> 00:00:20,100
מעיבוד רגיל,

6
00:00:20,459 --> 00:00:23,090
איטיים, ולפעמים תקועים ב-Loop אינסופי

7
00:00:23,459 --> 00:00:27,700
שהופך מודלים ללא-שמישים עבור הרבה יישומים בעולם האמיתי.

8
00:00:28,530 --> 00:00:30,639
הפתרון החדש והאלגנטי

9
00:00:31,010 --> 00:00:32,400
לבעיה הזו הוא

10
00:00:32,610 --> 00:00:33,490
מודלים היברידיים

11
00:00:34,169 --> 00:00:35,930
ו"תקציב המחשבה"

12
00:00:36,369 --> 00:00:37,930
שמאפשר לנו סוף סוף

13
00:00:38,130 --> 00:00:40,290
לשלוט בעוצמת החשיבה של ה-AI.

14
00:00:41,529 --> 00:00:42,880
וזה לא רק קונספט,

15
00:00:42,889 --> 00:00:44,970
זה פיצ'ר שאפשר לשלוט בו דרך ה-API.

16
00:00:46,250 --> 00:00:49,090
גוגל הציגה את ה-Thinking Budget במודלי

17
00:00:50,130 --> 00:00:52,639
Gemini 2.5 Flash ו-Pro.

18
00:00:53,020 --> 00:00:55,180
הם פשוט נתנו למפתחים סליידר.

19
00:00:55,250 --> 00:00:58,400
אתה יכול להגדיר במפורש כמה טוקנים אתה מרשה למודל

20
00:00:58,689 --> 00:00:59,680
"לבזבז"

21
00:00:59,889 --> 00:01:01,880
על חשיבה פנימית לפני שהוא עונה.

22
00:01:02,970 --> 00:01:05,050
טולסי דושי, מנהלת מוצר ב-Gemini:

23
00:01:05,849 --> 00:01:10,419
"למון פרומפטים פשוטים, המודל חושב הרבה יותר ממה שהוא צריך".

24
00:01:11,550 --> 00:01:15,360
השליטה הזו מאפשרת למפתחים למצוא את האיזון הנכון בין איכות,

25
00:01:15,470 --> 00:01:17,059
עלות וזמן תגובה.

26
00:01:18,300 --> 00:01:20,370
חברת Anthropic, עם Claude 3.7

27
00:01:21,660 --> 00:01:22,489
Sonnet,

28
00:01:22,860 --> 00:01:27,169
לקחה גישה קצת שונה עם Extended Thinking, או "חשיבה מורחבת".

29
00:01:27,500 --> 00:01:29,669
כשאתה מפעיל את המצב הזה, התשובה

30
00:01:30,819 --> 00:01:36,089
מה-API כוללת לא רק את הפתרון הסופי, אלא גם את כל המונולוג הפנימי של המודל,

31
00:01:36,680 --> 00:01:39,089
עטוף בתגיות thinking מיוחדות.

32
00:01:39,699 --> 00:01:41,019
דובר מטעמם אמר:

33
00:01:41,940 --> 00:01:45,180
"הגישה שלנו מבוססת על האופן שבו המוח האנושי עובד.

34
00:01:45,580 --> 00:01:49,050
לבני אדם אין שני מוחות נפרדים לחשיבה מהירה

35
00:01:49,419 --> 00:01:50,769
מול חשיבה עמוקה...

36
00:01:51,879 --> 00:01:54,800
בעוד שאינטראקציות מסוימות דורשות תגובות מהירות,

37
00:01:55,440 --> 00:01:57,529
אחרות, כמו ניתוח פיננסי מורכב,

38
00:01:57,599 --> 00:01:58,870
דורשות חשיבה

39
00:01:59,080 --> 00:01:59,870
עמוקה

40
00:02:00,250 --> 00:02:01,480
וארוכה יותר".

41
00:02:02,400 --> 00:02:04,870
זה גם צעד ענק לכיוון שקיפות,

42
00:02:05,080 --> 00:02:07,930
שמאפשר לאמת את תהליך החשיבה של המודל.

43
00:02:08,669 --> 00:02:11,229
הדילמה החדשה של המפתח היא כבר לא רק

44
00:02:11,529 --> 00:02:13,110
"באיזה מודל להשתמש?",

45
00:02:13,270 --> 00:02:14,910
אלא "איך להשתמש בו?",

46
00:02:15,589 --> 00:02:19,059
ואולי גם זה ייחסך מאיתנו עם הצגה של

47
00:02:19,309 --> 00:02:20,600
"מנצח החשיבה"

48
00:02:21,070 --> 00:02:22,600
(Reasoning Orchestrator).

49
00:02:23,149 --> 00:02:26,199
במקום שהאפליקציה תקבע תקציב מחשבה קבוע,

50
00:02:26,589 --> 00:02:32,139
יקומו מערכות-על שיידעו להקצות את התקציב באופן דינמי לכל שאילתה.

51
00:02:33,070 --> 00:02:35,029
המערכת תנתח את השאלה,

52
00:02:35,190 --> 00:02:36,779
תעריך את המורכבות שלה,

53
00:02:37,210 --> 00:02:40,660
ורק אז תחליט אם להפעיל את המוח המהיר והזול,

54
00:02:40,990 --> 00:02:44,300
או להעביר את הבקשה למסלול האיטי והיקר.

55
00:02:45,479 --> 00:02:51,750
האמת שזה feature שמאוד מזכיר את מודל ה-auto של Cursor שגם בוחר במודל המתאים,

56
00:02:52,240 --> 00:02:58,699
וגם את Claude code שישקיע יותר מחשבה אם תבקש ממנו to plan או to think really hard.

57
00:03:00,139 --> 00:03:04,899
המדד להצלחה של מודל AI כבר לא יכול להיות רק ציון במבחן.

58
00:03:05,619 --> 00:03:07,059
זה משולש של דיוק,

59
00:03:07,259 --> 00:03:08,679
זמן תגובה ועלות.

60
00:03:09,820 --> 00:03:12,229
הטרנד הזה מסמל גם התבגרות בתעשייה.

61
00:03:12,339 --> 00:03:13,490
מההייפ של

62
00:03:14,059 --> 00:03:18,100
"גדול יותר זה תמיד טוב יותר" לבינה מלאכותית היברידית,

63
00:03:18,619 --> 00:03:19,179
פרקטית,

64
00:03:19,779 --> 00:03:20,839
בת-קיימא,

65
00:03:21,100 --> 00:03:22,029
ובעיקר -

66
00:03:22,300 --> 00:03:23,020
נשלטת.

67
00:03:23,899 --> 00:03:27,570
מודלים חושבים, שגם מציגים את ה-Thinking שלהם

68
00:03:27,869 --> 00:03:29,169
הם פחות מסתוריים,

69
00:03:29,350 --> 00:03:30,899
פחות קופסה שחורה

70
00:03:31,229 --> 00:03:33,339
ויותר קופסת זכוכית,

71
00:03:33,910 --> 00:03:35,539
שבה יש לנו נראות

72
00:03:35,750 --> 00:03:36,940
ושליטה

73
00:03:37,190 --> 00:03:38,589
על מה שקורה בפנים.

74
00:03:39,610 --> 00:03:43,970
היכולת לחשוב היא מה שהופכת מודלי שפה לחזקים.

75
00:03:44,789 --> 00:03:47,850
היכולת לשלוט היא מה שתהפוך אותם

76
00:03:48,190 --> 00:03:49,100
לשימושיים.

77
00:03:50,399 --> 00:03:51,429
עד הפעם הבאה,

78
00:03:51,679 --> 00:03:52,470
תהיו טובים,

79
00:03:52,600 --> 00:03:54,199
ותמשיכו להיות סקרנים.

80
00:03:54,960 --> 00:03:55,470
יאללה ביי.