تاریخ انتشار: 28 آوریل 2025، آخرین به روز رسانی: 21 مه 2025
تکامل سریع هوش مصنوعی مرزهای جدیدی را برای برنامه های کاربردی وب به ویژه با ظهور قابلیت های روی دستگاه باز می کند. کشف کنید که چگونه CyberAgent، یک شرکت اینترنتی ژاپنی پیشرو، از هوش مصنوعی داخلی Chrome و Prompt API برای بهبود تجربه وبلاگ نویسی در پلتفرم خود، Ameba Blog استفاده می کند.
ما اهداف آنها، مزایای کار با هوش مصنوعی داخلی، چالشهایی که با آنها روبرو بودند و بینشهای ارزشمندی را برای توسعهدهندگان دیگر که از هوش مصنوعی داخلی استفاده میکنند به اشتراک میگذاریم.
Prompt API چیست؟
توضیح دهنده | وب | برنامه های افزودنی | وضعیت کروم | قصد |
---|---|---|---|---|
GitHub | مشاهده کنید | قصد آزمایش |
Prompt API به توسعه دهندگان کمک می کند تا از مدل های زبان بزرگ برای اضافه کردن ویژگی های هوش مصنوعی به طور مستقیم به برنامه های خود استفاده کنند. با تعریف درخواستهای سفارشی، برنامهها میتوانند کارهایی مانند استخراج داده، تولید محتوا و پاسخهای شخصیسازی شده را انجام دهند. در Chrome، Prompt API استنتاج سمت سرویس گیرنده را با Gemini Nano انجام می دهد. این پردازش محلی، صرف نظر از اینکه چه مدلی استفاده می شود، حریم خصوصی داده ها و سرعت پاسخگویی را افزایش می دهد. هر مدلی که استفاده می شود، سرعت پاسخگویی مشتری.
کمک هوش مصنوعی برای نویسندگان وبلاگ Ameba
CyberAgent یک نقطه درد مشترک را برای نویسندگان تشخیص داد: فرآیند اغلب وقت گیر ایجاد محتوای قانع کننده، به ویژه عناوین. آنها فرض کردند که ادغام عملکردهای مبتنی بر هوش مصنوعی در رابط ایجاد وبلاگ می تواند به طور قابل توجهی کیفیت و کارایی تولید محتوا را بهبود بخشد. هدف آنها ارائه ابزارهایی بود که الهام بخش هستند و به وبلاگ نویسان کمک می کنند تا محتوای جذاب ایجاد کنند.
CyberAgent یک برنامه افزودنی Chrome را با Prompt API توسعه داد. این برنامه افزودنی مجموعهای از ویژگیهای مبتنی بر هوش مصنوعی را ارائه میکند که برای کمک به نویسندگان وبلاگ Ameba در تولید عناوین و سرفصلها، پاراگرافهای بعدی و بهبودهای کلی کپی طراحی شدهاند.
CyberAgent انعطافپذیری قابلیتها را میخواست که مستقیماً به Prompt API منتهی شد. با امکانات بی نهایت در یک API، CyberAgent توانست دقیقاً تعیین کند که چه چیزی برای نویسندگان Ameba بهترین و مفیدتر است.
CyberAgent برنامه افزودنی را با تعدادی از وبلاگ نویسان آزمایش کرد که بینش های ارزشمندی را برای عملی بودن عملکردهای ارائه شده ارائه کرد. بازخورد به CyberAgent کمک کرد تا برنامه های بهتری را برای کمک هوش مصنوعی شناسایی کند و طراحی افزونه را اصلاح کند. بر اساس نتایج و بازخوردهای مثبت، CyberAgent به دنبال انتشار این ویژگی در آینده است و قدرت هوش مصنوعی سمت مشتری را مستقیماً به جامعه وبلاگ نویسی خود می آورد.
بیایید نگاهی دقیق تر به این ویژگی ها بیندازیم.
عناوین و عناوین بهتری بنویسید
برنامه افزودنی بر اساس محتوای کامل وبلاگ، پیشنهادهای عنوان متعددی را ایجاد می کند. نویسندگان وبلاگ می توانند این پیشنهادات را با گزینه هایی که عبارتند از: «بازسازی»، «مودب تر»، «معمولی تر» یا «ایجاد عناوین مشابه» و موارد دیگر اصلاح کنند.
CyberAgent رابط کاربری را به طور خاص طراحی کرده است تا کاربران مجبور نباشند هیچ درخواستی بنویسند. به این ترتیب، کاربرانی که با مهندسی سریع آشنایی ندارند نیز می توانند از قدرت هوش مصنوعی بهره مند شوند.
افزونه همچنین میتواند سرفصلهای قانعکنندهای را برای بخشهای جداگانه وبلاگ ایجاد کند، که نویسندگان میتوانند با انتخاب متن مربوطه برای عنوان درخواست کنند.
کد تولید عنوان با Prompt API شامل یک اعلان اولیه و یک درخواست کاربر است. اعلان اولیه زمینه و دستورالعمل هایی را برای دریافت نوع خاصی از خروجی می دهد، در حالی که درخواست های کاربر از مدل می خواهند که با آنچه کاربر می نویسد درگیر شود. درباره کد آنها در Deploy AI help بیشتر بخوانید.
پاراگراف های بعدی را ایجاد کنید
برنامه افزودنی به وبلاگ نویسان کمک می کند تا با ایجاد پاراگراف های بعدی بر اساس متن انتخاب شده، بر بلوک نویسنده غلبه کنند. با توجه به متن پاراگراف قبل، هوش مصنوعی ادامه پاراگراف را تهیه می کند و به نویسندگان اجازه می دهد تا جریان خلاقانه خود را حفظ کنند.
متن را بهبود و ویرایش کنید
Gemini Nano متن انتخاب شده را تجزیه و تحلیل می کند و می تواند پیشرفت هایی را پیشنهاد دهد. کاربران میتوانند با یادداشتهای اضافی در مورد لحن و انتخاب زبان، پیشرفتها را بازسازی کنند تا کپی را «زیباتر» یا «سادهتر» کنند.
کمک هوش مصنوعی را مستقر کنید
CyberAgent کد برنامه افزودنی خود را به سه مرحله تقسیم کرد: ایجاد جلسه، راهاندازی و درخواست مدل.
ابتدا با مرورگر بررسی میکنند که هوش مصنوعی داخلی در دسترس و پشتیبانی میشود. اگر بله، یک جلسه با پارامترهای پیش فرض ایجاد می کنند.
if (!LanguageModel) {
// Detect the feature and display "Not Supported" message as needed
return;
}
// Define default values for topK and temperature within the application
const DEFAULT_TOP_K = 3;
const DEFAULT_TEMPERATURE = 1;
let session = null;
async function createAISession({ initialPrompts, topK, temperature } = {}) {
const { available, defaultTopK, maxTopK, defaultTemperature } =
await LanguageModel.availability();
// "readily", "after-download", or "no"
if (available === "no") {
return Promise.reject(new Error('AI not available'));
}
const params = {
monitor(monitor) {
monitor.addEventListener('downloadprogress', event => {
console.log(`Downloaded: ${event.loaded} of ${event.total} bytes.`);
});
},
initialPrompts: initialPrompts || '',
topK: topK || defaultTopK,
temperature: temperature || defaultTemperature,
};
session = await LanguageModel.create(params);
return session;
}
هر ویژگی دارای یک تابع کمکی است که توسط کاربر راه اندازی می شود. پس از فعال شدن، هنگامی که کاربر روی دکمه مربوطه کلیک می کند، جلسه را متناسب با آن به روز می کند.
async function updateSession({ initialPrompts, topK, temperature } = {
topK: DEFAULT_TOP_K,
temperature: DEFAULT_TEMPERATURE,
}) {
if (session) {
session.destroy();
session = null;
}
session = await createAISession({
initialPrompts,
topK,
temperature,
});
}
پس از به روز رسانی جلسه، آنها مدل را با توجه به عملکرد درخواست می کنند. به عنوان مثال، در اینجا کدی برای تولید عنوان و بازسازی عنوان با لحن رسمی تر وجود دارد.
async function generateTitle() {
// Initialize the model session
await updateSession({
initialPrompts: [
{ role: 'system',
content: `Create 3 titles suitable for the blog post's content,
within 128 characters, and respond in JSON array format.`,
}
]
});
const prompt = `Create a title for the following
blog post.${textareaEl.textContent}`;
const result = await session.prompt(prompt);
try {
const fixedJson = fixJSON(result);
// display result
displayResult(fixedJSON);
} catch (error) {
// display error
displayError();
}
}
async function generateMoreFormalTitle() {
// Do not execute updateSession to reuse the session during regeneration
const prompt = 'Create a more formal title.';
const result = await session.prompt(prompt);
...
}
مزایای هوش مصنوعی داخلی
هوش مصنوعی داخلی نوعی هوش مصنوعی سمت مشتری است که به این معنی است که استنتاج در دستگاه کاربر رخ می دهد. CyberAgent به دلیل مزایای قانعکنندهای که برای توسعهدهندگان برنامه و کاربران ارائه میکند، استفاده از APIهای هوش مصنوعی داخلی را با Gemini Nano انتخاب کرد.
مزایای کلیدی CyberAgent که بر روی آنها متمرکز شده است عبارتند از:
- امنیت و حریم خصوصی
- هزینه
- پاسخگویی و قابلیت اطمینان
- سهولت توسعه
امنیت و حریم خصوصی
توانایی اجرای مدل های هوش مصنوعی به طور مستقیم بر روی دستگاه کاربر بدون انتقال داده ها به سرورهای خارجی بسیار مهم است. قرار نیست پیشنویسهای وبلاگ برای عموم دیده شوند، و بنابراین، CyberAgent نمیخواهد این پیشنویسها را به سرور شخص ثالث ارسال کند.
هوش مصنوعی داخلی Gemini Nano را در دستگاههای کاربر دانلود میکند و نیازی به ارسال و دریافت دادهها از سرورها را از بین میبرد. این به ویژه هنگام نوشتن مفید است، زیرا پیش نویس ها ممکن است حاوی اطلاعات محرمانه یا عبارات ناخواسته باشند. هوش مصنوعی داخلی محتوای اصلی و تولید شده را به جای ارسال به سرور محلی نگه میدارد، که میتواند امنیت را افزایش داده و از حریم خصوصی محتوا محافظت کند.
صرفه جویی در هزینه
یکی از مزایای اصلی استفاده از هوش مصنوعی داخلی این است که مرورگر شامل Gemini Nano است و استفاده از APIها رایگان است. هیچ هزینه اضافی یا پنهانی وجود ندارد.
هوش مصنوعی داخلی به طور قابل توجهی هزینه های سرور را کاهش می دهد و می تواند هزینه های مرتبط با استنباط هوش مصنوعی را به طور کامل حذف کند. این راهحل میتواند به سرعت برای یک پایگاه کاربری بزرگ مقیاسپذیر باشد و به کاربران اجازه میدهد تا درخواستهای متوالی را برای اصلاح خروجیها بدون پرداخت هزینههای اضافی ارسال کنند.
پاسخگویی و قابلیت اطمینان
هوش مصنوعی داخلی، زمان پاسخگویی ثابت و سریع، مستقل از شرایط شبکه را فراهم می کند. این به کاربران امکان میدهد بارها و بارها محتوا تولید کنند، که باعث میشود کاربران بتوانند ایدههای جدید را امتحان کنند و نتیجه نهایی رضایتبخشی را به سرعت ایجاد کنند.
سهولت توسعه
هوش مصنوعی داخلی کروم با ارائه یک API به راحتی در دسترس، فرآیند توسعه را ساده می کند. توسعه دهندگان از آسانی ایجاد ویژگی های مبتنی بر هوش مصنوعی برای برنامه خود سود می برند.
Gemini Nano و APIهای هوش مصنوعی داخلی در کروم نصب شدهاند، بنابراین نیازی به راهاندازی یا مدیریت مدل اضافی نیست. APIها مانند سایر APIهای مرورگر از جاوا اسکریپت استفاده می کنند و نیازی به تخصص در یادگیری ماشین ندارند.
پیمایش چالش ها برای نتایج بهتر
سفر CyberAgent با Prompt API درس های ارزشمندی در مورد تفاوت های ظریف کار با LLM های سمت مشتری ارائه کرد.
- پاسخ های متناقض : مانند سایر LLM ها، Gemini Nano خروجی های یکسانی را برای همان درخواست تضمین نمی کند. CyberAgent با پاسخ هایی در قالب های غیرمنتظره (مانند Markdown و JSON نامعتبر) مواجه شد. حتی با دستورالعمل ها، ممکن است نتایج بسیار متفاوت باشد. هنگام پیادهسازی هر برنامه یا برنامه افزودنی کروم با هوش مصنوعی داخلی، اضافه کردن یک راه حل برای اطمینان از اینکه خروجی همیشه در فرمت صحیح است، ممکن است مفید باشد.
- محدودیت رمز : مدیریت استفاده از رمز بسیار مهم است. CyberAgent از ویژگی ها و روش هایی مانند
inputUsage
،inputQuota
وmeasureInputUsage()
برای مدیریت جلسات ، حفظ زمینه و کاهش مصرف توکن استفاده کرد. این به ویژه در هنگام اصلاح عناوین مهم بود. - محدودیت های اندازه مدل : از آنجایی که مدل دانلود می شود و در دستگاه کاربر زندگی می کند، به طور قابل توجهی کوچکتر از مدل مبتنی بر سرور است. این بدان معناست که برای دستیابی به نتایج رضایت بخش، به ویژه برای خلاصه کردن، فراهم کردن زمینه کافی در اعلان ضروری است. درباره درک اندازه های LLM بیشتر بیاموزید.
CyberAgent تأکید میکند که اگرچه مدلهای سمت کلاینت هنوز در همه مرورگرها و دستگاهها در دسترس نیستند، و مدلهای کوچکتر محدودیتهایی دارند، اما همچنان میتواند عملکرد چشمگیری را برای کارهای خاص ارائه دهد. توانایی تکرار سریع و آزمایش بدون هزینه های سمت سرور، آن را به یک ابزار ارزشمند تبدیل می کند.
آنها به یافتن تعادل توصیه میکنند و تشخیص میدهند که دستیابی به پاسخهای بینقص با هر هوش مصنوعی، چه سمت سرور یا سمت مشتری، دشوار است. در نهایت، آنها آینده ای را می بینند که در آن یک رویکرد ترکیبی، ترکیبی از نقاط قوت هوش مصنوعی سمت سرور و سمت مشتری، پتانسیل بیشتری را باز خواهد کرد.
نگاه به جلو
کاوش CyberAgent در هوش مصنوعی داخلی، امکانات هیجان انگیز ادغام یکپارچه هوش مصنوعی را برای بهبود تجربه کاربر به نمایش می گذارد. برنامه افزودنی آنها که برای کار با Ameba Blog ساخته شده است، نشان می دهد که چگونه می توان این فناوری ها را به طور عملی برای حل مشکلات دنیای واقعی به کار برد و درس های ارزشمندی را برای جامعه توسعه وب گسترده تر ارائه داد.
همانطور که فناوری رشد می کند و پشتیبانی از مرورگرها و دستگاه ها گسترش می یابد، انتظار داریم حتی برنامه های نوآورانه تری از هوش مصنوعی داخلی و سایر اشکال هوش مصنوعی سمت مشتری را مشاهده کنیم.
منابع
- درباره Prompt API بیشتر بدانید
- شروع به استفاده از API های داخلی در کروم کنید
- مطالعه موردی CyberAgent در زمینه هوش مصنوعی وب ، که همین موضوع را پوشش می دهد.
- تماشا کنید آینده هوش مصنوعی اکنون است ، مطالعات موردی CyberAgent در مورد هوش مصنوعی سمت مشتری
قدردانی
از وبلاگ نویسان Ameba، ao ، Nodoka ، Erin ، Chiaki ، و socchi که بازخورد ارائه کردند و به بهبود برنامه افزودنی کمک کردند، سپاسگزاریم. از توماس اشتاینر ، الکساندرا کلپر ، و سباستین بنز برای کمک به نوشتن و بررسی این پست وبلاگ سپاسگزاریم.