API Prompt

Publicado em 20 de maio de 2025

Explicação Web Extensões Status do Chrome Intenção
GitHub Experimental No EPP Chrome Beta Chrome 137 Beta Ver Intent to Experiment

Com a API Prompt, você pode enviar solicitações de linguagem natural para o Gemini Nano no navegador.

A API Prompt está disponível para extensões do Chrome. Os desenvolvedores da Web podem usar a API de teste no Chrome Canary participando do Programa de prévia antecipada. Essa API vai estar disponível em breve em um teste de origem.

Há muitas maneiras de usar a API Prompt. Em um aplicativo da Web ou site, é possível criar:

  • Pesquisa com tecnologia de IA: responda a perguntas com base no conteúdo de uma página da Web.
  • Feeds de notícias personalizados: crie um feed que classifique dinamicamente os artigos com categorias e permita que os usuários filtrem esse conteúdo.

Nas extensões do Chrome, é possível criar:

  • Eventos da agenda. Desenvolva uma extensão do Chrome que extraia automaticamente detalhes de eventos de páginas da Web para que os usuários possam criar entradas de agenda em apenas algumas etapas.
  • Extração de contatos. Crie uma extensão que extraia informações de contato de sites, facilitando o contato dos usuários com uma empresa ou a adição de detalhes à lista de contatos.

Essas são apenas algumas possibilidades, mas queremos saber o que você vai criar.

Usar a API Prompt

Há duas funções principais disponíveis no namespace LanguageModel:

  • availability() para verificar o que o modelo é capaz de fazer e se ele está disponível.
  • create() para iniciar uma sessão de modelo de linguagem.

Download do modelo

A API Prompt usa o modelo Gemini Nano no Chrome. Embora a API esteja integrada ao Chrome, o modelo é transferido por download separadamente na primeira vez que uma extensão usa a API.

Para determinar se o modelo está pronto para uso, chame a função LanguageModel.availability() assíncrona. Isso vai retornar uma das seguintes respostas:

  • "unavailable" significa que o navegador não oferece suporte às opções solicitadas ou não oferece suporte para solicitar um modelo de linguagem.
  • "downloadable" significa que o navegador oferece suporte às opções solicitadas, mas precisa fazer o download de algo (por exemplo, o modelo de linguagem ou um ajuste fino) antes de criar uma sessão usando essas opções.
  • "downloading" significa que o navegador oferece suporte às opções solicitadas, mas precisa concluir uma operação de download em andamento antes de criar uma sessão usando essas opções.
  • "available" significa que o navegador oferece suporte às opções solicitadas sem exigir novos downloads.

Se a resposta para availability() for 'downloadable', detecte o progresso do download e informe o usuário, caso o download demore.

const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded} of ${e.total} bytes.`);
    });
  },
});

Recursos multimodais

A API Prompt oferece suporte a entradas de áudio e imagem do Chrome 138 Canary para experimentação local. A API retorna uma saída de texto.

Com esses recursos, é possível:

  • Permitir que os usuários transcrevam mensagens de áudio enviadas em um app de chat.
  • Descreva uma imagem enviada para seu site para uso em uma legenda ou texto alternativo.

Seu feedback ajuda a definir o futuro dessa API e melhorias no Gemini Nano. Isso pode até resultar em APIs de tarefas dedicadas (como APIs para transcrição de áudio ou descrição de imagem), garantindo que atendamos às suas necessidades e às necessidades dos seus usuários.

Participar e compartilhar feedback

Sua contribuição pode afetar diretamente a criação e implementação de versões futuras dessa API e de todas as APIs de IA integradas.