게시일: 2025년 5월 22일
AI는 웹 개발자가 웹사이트와 웹 애플리케이션을 빌드하는 방식을 변화시키고 있습니다. Google I/O 2025에서는 지난 1년간 진행한 작업을 공유하고, 파트너가 웹에서 AI를 활용하는 방법을 시연했으며, 새로운 내장 AI API를 발표했습니다.
이벤트를 놓치셨나요? 이제 강연을 주문형으로 시청할 수 있다는 반가운 소식을 전해드립니다.
Chrome의 Gemini Nano를 통한 실용적인 기본 제공 AI
Google의 핵심 사명은 모든 개발자와 모든 사용자를 위해 Chrome과 웹을 더 스마트하게 만드는 것입니다. 이 강연에서 토마스 슈타이너는 내장 AI 업데이트, 실용적인 사용 사례, 미래 전망을 공유합니다.
내장 AI는 브라우저에서 클라이언트 측 모델을 실행하므로 다음과 같은 몇 가지 이점이 있습니다.
- 비공개: 민감한 사용자 데이터는 기기에 남아 있으므로 브라우저를 벗어나지 않아도 됩니다.
- 오프라인: 애플리케이션은 인터넷에 연결되어 있지 않아도 AI 기능에 액세스할 수 있습니다.
- 성능이 우수함: 이러한 API는 하드웨어 가속 덕분에 우수한 성능을 제공합니다.
각 기본 제공 AI API의 코드 샘플을 살펴보고 상태에 대한 업데이트를 확인하고 이 기술을 구현하는 업체를 알아보세요.
Multimodal API
새로운 멀티모달 API를 개발하고 있습니다. 즉, Gemini Nano에게 시각적 콘텐츠에서 '보는' 것 또는 오디오 콘텐츠에서 '듣는' 것에 관해 물어볼 수 있습니다. 예를 들어 블로그 플랫폼에서 사용자가 수정할 수 있는 업로드된 이미지의 대체 텍스트 추천을 가져올 수 있습니다. 또는 Gemini Nano에게 팟캐스트의 설명이나 스크립트를 작성해 달라고 요청할 수 있습니다.
하이브리드 AI
개발자가 클라이언트 측 AI에서 직면하는 한 가지 문제는 일부 플랫폼과 브라우저가 기기에서 모델을 실행하기 위한 하드웨어 요구사항을 충족하지 않는다는 점입니다. Gemini와 Firebase는 파트너십을 맺고 Firebase 웹 SDK를 빌드하여 클라이언트 측 구현을 사용할 수 없는 경우 서버의 Gemini Nano로 대체할 수 있도록 했습니다.
고객님과 함께
내장 AI API를 위해 많은 개발자와 협력하게 되어 기쁩니다. 고객님의 참여가 없으면 Google의 노력도 불가능합니다.
- 사전 체험판 프로그램: 16,000명 이상의 개발자가 EPP에 참여하여 새로운 API를 테스트하고, 새로운 사용 사례를 발견하고, 웹용 AI를 개선하기 위한 의견을 제공했습니다.
- 해커톤: 해커톤 2개를 개최했으며 멋진 웹사이트와 확장 프로그램을 제작하셨습니다.
아직 끝난 것이 아닙니다. 의견을 공유하고 새로운 내장 API를 테스트해 주세요. Google은 계속해서 개선해 나가겠습니다. W3C의 웹 머신러닝 커뮤니티 그룹에 가입하여 이러한 API의 표준화를 도울 수도 있습니다.
브라우저에서 Gemini를 사용한 Chrome 확장 프로그램의 미래
AI 기반 확장 프로그램의 수는 지난 2년 동안 두 배로 증가했습니다. 실제로 Chrome 웹 스토어에서 설치된 모든 확장 프로그램의 10% 가 AI를 사용합니다. 이 강연에서 세바스티안 벤츠는 Chrome 확장 프로그램과 Gemini가 매우 강력한 조합인 이유를 보여주는 실용적인 예시를 제공합니다.
예를 들어 Chrome의 새로 출시된 프롬프트 API를 사용하여 클라이언트의 웹사이트에서 데이터를 추출하고 처리하여 브라우저를 더 유용하게 만드는 방법이 있습니다.
Chrome 확장 프로그램에서 Chrome의 프롬프트 API의 새로운 다중 모드 기능을 과도하게 사용하여 사용자가 오디오와 이미지에 더 쉽게 액세스할 수 있도록 합니다.
Google DeepMind의 Project Mariner가 Chrome 확장 프로그램과 최신 Gemini Cloud API를 사용하여 본격적인 브라우저 에이전트를 빌드하는 방법을 설명하여 탐색의 미래를 살펴봅니다.
클라우드 또는 Chrome 확장 프로그램의 브라우저에서 Gemini를 사용하여 새로운 탐색 환경을 구축하고 브라우저를 더 유용하게 만드는 방법을 살펴보세요.
실제 웹 AI 사용 사례 및 전략
Yuriko Hirota와 Swetha Gopalakrishnan은 웹에서 AI를 사용하여 비즈니스와 사용자 경험을 개선하는 기업의 실제 사례를 강조했습니다.솔루션이 클라이언트 측 모델, 서버 측 모델 또는 하이브리드 솔루션을 사용하는지와 관계없이 중요한 것은 지금 바로 사용자에게 제공할 수 있는 흥미로운 새로운 기능입니다.
BILIBILI는 번호 매기기 스크린 댓글이라는 새로운 기능을 도입하여 동영상 스트림의 참여도를 높였습니다. 동영상에서 발표자 뒤에 렌더링된 실시간 사용자 댓글을 제공합니다. 이를 위해 잘 알려진 머신러닝 개념인 이미지 세분화를 사용합니다. 그 결과 세션 시간이 30% 증가했습니다. Tokopedia는 얼굴 감지 모델을 사용하여 판매자 인증 절차의 불편을 줄이고 업로드된 사진의 품질을 평가했습니다. 그 결과 수동 승인이 거의 70% 감소했습니다.
뇌 시각 장애 (CVI) 아동을 위한 웹 플랫폼인 Vision Nanny는 AI 기반 시각 자극 활동을 제공합니다. 이러한 모델은 이미지, 동영상 또는 실시간으로 손의 주요 지점을 찾는 손 랜드마크 감지 모델을 비롯한 여러 MediaPipe 라이브러리를 사용합니다. 50명의 아동을 대상으로 한 파일럿에서는 Vision Nanny가 수동 시각적 자극 활동보다 5배 더 빠르게 반응을 제공하는 것으로 나타났습니다. 치료사들은 수동 설정을 삭제하여 세션당 평균 3시간을 절약했다고 보고했습니다.
Google Meet에는 조명 개선부터 흐리게 처리된 동영상과 흐릿한 동영상 감소에 이르기까지 AI를 통해 사용 설정된 여러 기능이 있습니다. 가장 큰 문제는 이러한 기능이 실시간으로 작동해야 한다는 점입니다. 여기에서 WebAssembly (Wasm)가 컴퓨터의 CPU를 최대한 활용하고 실시간 동영상 처리를 지원합니다.
다음은 웹에서 이루어지는 AI의 실제 사례 중 일부입니다. 다른 여러 회사에서도 내장 AI API를 실험했으며, 그중 일부는 우수사례에서 작업 내용을 공유했습니다.
더 스마트한 미래 사용자 환경을 구축하기 위한 클라이언트 측 웹 AI 에이전트
제이슨 메이즈는 인터넷의 미래인 웹 AI 상담사를 소개했습니다. 웹은 대규모 언어 모델 (LLM)의 기능을 넘어 사용자를 대신하여 유용한 작업을 수행하기 위해 AI 기능을 브라우저에 직접 제공하는 에이전트의 미래를 보유하고 있습니다.
클라이언트 측 접근 방식을 사용하면 개인 정보 보호가 강화되고 지연 시간이 줄어들며 상당한 비용 절감이 가능합니다. 상담사를 사용하면 기존 웹사이트를 업그레이드하고, 노출된 도구를 동적으로 선택하고 사용하여 사용자를 대신해 작업을 자동으로 실행할 수 있습니다. 이때 루프를 통해 작업을 실행할 수도 있습니다. 이를 통해 상담사는 복잡하거나 여러 단계로 구성된 작업을 완료할 수 있습니다.
상담사는 다음 작업을 할 수 있습니다.
- 하위 작업 계획 및 분할: 다단계 계획을 통해 더 복잡한 문제를 처리하여 작업을 완료할 논리적 단계로 분류합니다.
- 함수, API 사용, 증강 언어 모델의 기본 지식에 대한 데이터 스토어 액세스 등 최적의 도구를 선택한 다음 외부에서 작업을 실행합니다.
- 에이전트 또는 외부 도구의 이전 출력을 기반으로 컨텍스트 기반 메모리를 유지합니다. 단기 메모리는 모델의 컨텍스트 창 크기까지 컨텍스트 기록의 FIFO 버퍼처럼 작동하는 반면, 장기 메모리는 벡터 데이터베이스를 사용하여 이전 대화 세션 또는 다른 데이터 소스에서 필요에 따라 완전히 검색할 정보를 저장하는 데 사용할 수 있습니다.
웹 AI 상담사는 JavaScript의 기존 웹 기술에 통합되도록 설계되었습니다. 궁극적으로 브라우저에서 모델을 가장 효과적으로 실행할 수 있도록 하드웨어를 계속 가속화하는 것이 중요합니다. 향후 WebNN과 같은 기술은 CPU, GPU, NPU 전반에서 모델 실행을 최적화하는 데 중요한 역할을 할 것입니다. LLM이 점점 작아지고 계속 발전함에 따라 앞으로는 더욱 강력해질 것입니다.
기기 내 처리와 전략적 클라우드 호출을 결합한 하이브리드 접근 방식을 사용하면 지금 바로 브라우저에서 지능적이고 반응이 빠르며 맞춤설정된 사용자 환경을 만들 수 있습니다. 기기에서 LLM을 실행하는 기능이 향상되면 곧 웹 AI 접근 방식에 투자한 결과가 보상을 받을 것입니다.
Google I/O 2025 소식 확인하기
Google I/O 2025의 모든 강연이 웹 개발자 전용 재생목록과 함께 공개되었습니다. io.google/2025에서 더 많은 동영상을 시청하세요.