Prompt API

תאריך פרסום: 20 במאי 2025

הסבר פיתוח אתרים תוספים סטטוס Chrome כוונת רכישה
GitHub ניסיוני ב-EPP Chrome בטא Chrome 137 בטא תצוגה כוונה לערוך ניסוי

באמצעות Prompt API, אפשר לשלוח בקשות בשפה טבעית ל-Gemini Nano בדפדפן.

Prompt API זמין לתוספים ל-Chrome. מפתחי אינטרנט יכולים להשתמש ב-API הניתוחי ב-Chrome Canary על ידי הצטרפות לתוכנית ה-Early Preview. ה-API הזה יהיה זמין בקרוב בתקופת ניסיון במקור.

יש הרבה דרכים להשתמש ב-Prompt API. באפליקציית אינטרנט או באתר, אפשר ליצור:

  • חיפוש מבוסס-AI: קבלת תשובות לשאלות על סמך התוכן של דף אינטרנט.
  • פידים מותאמים אישית של חדשות: אפשר ליצור פיד שמסווג באופן דינמי מאמרים לפי קטגוריות, ומאפשר למשתמשים לסנן את התוכן הזה.

בתוספים ל-Chrome אפשר ליצור:

  • אירועים ביומן. פיתוח תוסף ל-Chrome שחולץ באופן אוטומטי פרטי אירועים מדפי אינטרנט, כדי שמשתמשים יוכלו ליצור רשומות ביומן בכמה שלבים בלבד.
  • חילוץ אנשי קשר. תוכלו ליצור תוסף שיאחזר פרטים ליצירת קשר מאתרים, כדי שיהיה למשתמשים קל יותר ליצור קשר עם עסק או להוסיף פרטים לרשימת אנשי הקשר שלהם.

אלה רק כמה אפשרויות, אבל אנחנו סקרנים לראות מה יהיו התוצרים שלכם.

שימוש ב-Prompt API

יש שתי פונקציות עיקריות שזמינות במרחב השמות LanguageModel:

  • availability() כדי לבדוק מה המודל מסוגל לעשות ואם הוא זמין.
  • create() כדי להתחיל סשן של מודל שפה.

הורדת המודל

ב-Prompt API נעשה שימוש במודל Gemini Nano ב-Chrome. ה-API מובנה ב-Chrome, אבל המודל מוריד בנפרד בפעם הראשונה שתוסף משתמש ב-API.

כדי לבדוק אם המודל מוכן לשימוש, צריך להפעיל את הפונקציה LanguageModel.availability() האסינכרונית. הפונקציה אמורה להחזיר אחת מהתגובות הבאות:

  • הערך "unavailable" מציין שהדפדפן לא תומך באפשרויות המבוקשות, או שהוא לא תומך בכלל בהצגת הנחיה לבחירת מודל שפה.
  • הערך "downloadable" מציין שהדפדפן תומך באפשרויות המבוקשות, אבל הוא יצטרך להוריד משהו (לדוגמה, מודל השפה עצמו או כוונון מדויק) כדי שיוכל ליצור סשן באמצעות האפשרויות האלה.
  • הערך "downloading" מציין שהדפדפן תומך באפשרויות המבוקשות, אבל צריך לסיים פעולת הורדה מתמשכת כדי ליצור סשן באמצעות האפשרויות האלה.
  • הערך "available" מציין שהדפדפן תומך באפשרויות המבוקשות בלי צורך בהורדות חדשות.

אם התשובה ל-availability() היא 'downloadable', צריך להאזין להתקדמות ההורדה ולהודיע למשתמש אם ההורדה נמשכת זמן רב.

const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded} of ${e.total} bytes.`);
    });
  },
});

יכולות מולטי-מודאליות

Prompt API תומך בקלט של אודיו ותמונות מ-Chrome 138 Canary, לצורך ניסויים מקומיים. ה-API מחזיר פלט טקסט.

בעזרת היכולות האלה תוכלו:

  • המשתמשים יכולים לתמלל הודעות אודיו שנשלחות באפליקציית צ'אט.
  • מתארים תמונה שהועלו לאתר לשימוש בכיתוב או בטקסט חלופי.

המשוב שלכם יעזור לנו לקבוע את הכיוון של ה-API הזה ואת השיפורים שיבוצעו ב-Gemini Nano. יכול להיות שכתוצאה מכך נפתח ממשקי API ייעודיים למשימות (כמו ממשקי API לתמלול אודיו או לתיאור תמונות), כדי שנוכל לענות על הצרכים שלכם ועל הצרכים של המשתמשים שלכם.

להשתתף ולשלוח משוב

המשוב שלכם יכול להשפיע ישירות על האופן שבו אנחנו מפתחים ומטמיעים גרסאות עתידיות של ה-API הזה וכל ממשקי ה-API המובנים של AI.