XREAL
Vision
🔍

2023 Google I/O 톺아보기

2023 Google I/O 공식 트레일러 영상

혁신을 꾀한다! Google I/O

5월 10일, 2023 Google I/O가 개최되었습니다. Google I/O는 개발자 대상 컨퍼런스로, 구글이 새로 출시하는 제품과 서비스를 발표하고, 이를 개발하고 향상하는 방법을 가르치기 위해 매년 열리는 행사입니다.
2014년부터 구글은 I/O 행사에서 안드로이드, 크롬, 구글 어시스턴트, 구글 드라이브 등 다양한 제품과 서비스를 발표해 왔습니다. 매년 전 세계에 다양하고 뛰어난 경험을 제공하였던 구글이 과연 2023년에는 어떠한 새로운 기술과 혁신적인 제품들을 통해 또 다른 경험을 제공하려 하였는지 알아보고자 합니다.

2023 Google I/O의 핵심은 역시나 “AI”

‘AI 퍼스트’를 표방한 2016년 이래로 7년이 지난 지금, 구글은 AI를 더욱 유용하게 만들 기회를 포착하였습니다.
이미 오래전부터 제품을 근본적으로 더 유용하게 만들기 위해 AI를 연구하고 적용해 온 구글이 한 단계 더 나아가기 위해 채택한 2023년의 모토는 다음과 같습니다.
making AI helful for people
making AI helpful for businesses
making AI helpful for communities
making AI helpful for everyone

어떤 기능과 제품들이 공개되었나?

PaLM 2 : 최신 대규모 언어 모델 (LLM)

2022년에 공개된 PaLM의 새로운 버전, 차세대 LLM 모델 PaLM2
구글은 업데이트된 Bard 채팅 도구(OpenAI의 ChatGPT의 경쟁사)에 탑재되는 새로운 언어 모델, PaLM2의 출시를 예고하였습니다. PaLM 2는 Bard뿐 아니라 구글에서 개발하는 대부분의 새로운 AI 기능의 기본 모델 역할을 할 것이라 설명하였는데요, 구글은 브리핑을 통해 모델의 크기보다는 크기의 다양성에 주목하였다고 밝혔습니다.
OpenAI와 마찬가지로 매개변수 수를 포함하여 어떻게 차세대 모델을 학습시켰는지에 대한 정보는 제공하지 않았지만, 대량의 수학 및 과학 텍스트와 수학적 표현, 그리고 100개 이상의 언어를 포함하는 말뭉치로 모델을 훈련시켜, 상식적인 추론, 수학, 논리, 및 다국어 작업에 탁월한 모델임을 강조하였습니다. PaLM 2는 20개의 프로그래밍 언어 학습을 통해 코드 작성 및 디버깅에 대한 지원 또한 개선되었다고 밝혔습니다.
구글은 의학 지식에 중점을 둔 모델인 Med-PaLM2보안 사용 사례에 초점을 맞춘 모델인 Sec-PaLM 또한 공개하며 AI를 선도하는 기업으로서의 입지를 굳히겠다는 포부를 드러내었습니다.

Bard : 더욱 똑똑해진 AI 챗봇

구글만의 AI 챗봇, Bard
지금까지의 Bard AI 챗봇은 Bing Chat과 ChatGPT와 비교되어 호평받지 못했습니다. 과거 구글 광고에서 Bard가 오답을 내는 장면이 송출되면서 주가가 급락하는 상황이 벌어지기도 하였는데요,
컨퍼런스를 통해 구글은 Bard의 대기자 명단을 삭제하고 180개 이상의 국가 및 지역에서 누구나 Bard를 사용할 수 있도록 할 뿐 아니라, 일본어와 한국어 지원을 시작으로 40개 언어를 지원할 것을 약속하여 호의적인 반응을 기대하고 있음을 밝혔습니다.
이미지를 인식하여 사용자가 원하는 응답을 제공하는 Bard
사용자의 요구에 따라 코드를 생성하는 Bard
이번 업데이트를 통해 Bard는 응답에 이미지를 표시할 수 있는 기능, 코드 생성 기능과 코드 디버깅에 도움을 주는 기능, Google Maps를 사용하여 결과를 매핑하고 테이블에 데이터를 구조화할 수 있는 기능, 다크 모드 기능 등의 출시를 발표하며 Bard의 환골탈태를 예고하였습니다.
추가로, 구글의 자체 앱과 서비스에서 Bard를 위한 확장 기능 및 Adobe와의 협력을 예고하며 타사 서비스와의 파트너십 또한 강화하겠다고 설명하였습니다.
기존까지 Generative AI를 구축하는 데 초점을 맞추었던 구글은 Bard의 발전을 통해 더욱 폭넓은 AI 발전에 앞장서겠다는 의지를 내보였습니다.

Magic Editor : AI를 활용한 새로운 편집 경험

Google Photos의 Magic Editor 기능
구글은 생성 AI를 활용하여 사진을 재구성하고 편집을 더욱 쉽게 만드는 Magic Editor를 공개했습니다.
Magic Editor를 사용하여 사진 내의 특정 피사체의 위치를 변경하는 모습
Magic Editor를 사용하여 사진 내의 배경 이미지를 편집하는 모습
Magic Editor를 사용하면 사진에서 특정 피사체를 인식하고, 해당 피사체의 위치를 변경하여도 그로 인해 생기는 공백이 적절히 메워집니다. 생성 AI를 활용하여 원본 사진에서 포착되지 않은 배경과 주변 요소의 일부를 자동으로 재현하고, 이를 통해 사진의 최종 모양과 느낌을 완성합니다. 이뿐 아니라 하늘과 같은 배경 이미지의 특정 부분을 따로 편집할 수 있게 하여 특별한 편집 기술 없이도 전문가 수준의 복잡한 편집을 가능케 합니다.
Magic Editor는 올해 말 Google Photos에 출시될 예정이며, 일부 Pixel 폰에서 Magic Editor에 대한 사전 엑세스 권한을 제공할 예정입니다.

Google Maps : 몰입형 경로 보기 경험

구글은 Google Maps에 추가될 새로운 몰입형 경로 보기 기능을 공개하였습니다. 구글은 computer vision과 AI를 활용하여 수십억 개의 street view와 항공 정보를 융합한 세계의 디지털 모델을 생성해 내 기존에 메타포로만 즐길 수 있던 전 세계의 모습을 실제와 거의 유사하게 볼 수 있게 하였습니다.
구글이 오랜 기간 수집한 현재 및 과거 데이터를 기반으로 특정 시간대의 교통 상황과 특정 날짜의 날씨까지 예상된 상황을 실제처럼 볼 수 있으며, 교통 시뮬레이션, 자전거 도로, 주차, 복잡한 교차로 등의 정보를 포함하여 다차원적인 환경을 실감 나게 볼 수 있습니다.
특정 장소까지의 이동 경로를 현실의 모습과 매우 유사하게 볼 수 있는 Google Maps 화면
또한 Google은 조감도 API와 3D 타이틀을 실험적으로 출시한다고 발표하였는데요, 이를 통해 개발자는 미리 패키지된 조감도 동영상을 앱과 웹사이트에 포함해 장소의 모습을 시각적으로 보여줄 수 있으며, 맞춤형 시각 자료를 쉽게 만들 수 있게 됩니다.
몰입형 경로 보기 기능은 암스테르담, 베를린, 더블린, 피렌체, 라스베이거스, 런던, 로스앤젤레스, 마이애미, 뉴욕, 파리, 샌프란시스코, 산호세, 시애틀, 도쿄, 베네치아 등 15개 도시에서 수개월 내로 출시될 예정이며, 이 기능은 Android와 iOS 모두에서 출시됩니다.

Google Workspace : 생성형 AI의 도입

구글은 Google Workspace를 통해 다양한 사용자들에게 편리함과 효율을 제공하였습니다.
이번 행사를 통해 구글은 Workspace 제품군에도 생성형 AI를 도입하여 더욱 스마트한 기능의 출시를 예고하였습니다.
구글 스프레드 시트 내에 작성된 글을 분석하여 이에 알맞은 이미지를 검색해 내고 생성하는 기술이 도입된 모습
Google Spreadsheets에는 표(수식 제외)를 자동으로 생성하고 슬라이드와 Google Meet에서 원하는 시각화의 종류를 입력하면 AI가 해당 이미지를 생성하는 기능을 추가하였습니다. 이를 통해 소규모 비즈니스에서 사용자에게 일종의 개인화된 템플릿과 샘플 콘텐츠를 제공하고, Google Meet의 경우 사용자 지정 배경과 같은 시각 자료를 쉽게 적용할 수 있게 하였다고 설명하였습니다.
이뿐 아니라 Vertex AI 플랫폼을 활용한 Google Cloud 서비스를 제공하여 작업 시간은 80%, 작업 비용은 50% 감소할 것임을, 다양한 제품군에 Bard 챗봇 형태의 채팅 인터페이스를 추가하여 사용자의 문서 작성 작업에 더 나은 경험을 제공할 것임을 예고하였습니다.
해당 기능은 모바일용 Gmail과 Google 문서 도구에서도 지원됩니다.
MusicLM
Find My Device
Project Tailwind
이 밖에도 텍스트를 음악으로 바꾸는 실험적인 AI 도구 [MusicLM], Apple의 AirTag 기능 지원을 통해 사용자 주변의 알 수 없는 tracker에 대한 경고를 하여 사용자의 장치를 찾을 수 있게 하는 [Find My Device], 사용자의 구글 드라이브에서 파일의 내용을 기반으로 자동으로 문서를 정리하고 선별하여 개인화된 인터페이스를 제공하는 [Project Tailwind], 구글의 text-to-image diffusion 모델을 사용하여 사용자가 원하는 키워드에 맞춰 독창적인 배경 화면을 생성하는 [Generative AI wallpapers], 특정 비디오의 언어를 번역한 후, 오디오뿐 아니라 비디오의 화자의 입 모양 또한 해당 언어의 발음 방식과 비슷하게 구성하여 출력하는 [Universal Translator] 등을 공개하였습니다.
사용자가 입력한 키워드에 맞는 이미지를 생성하는 모습
비디오의 언어를 번역하고, 이에 맞는 입 모양을 적용하여 출력된 영상

구글은 무슨 말을 하고 싶었을까요?

구글은 이번 행사를 통해 이제는 일상생활과 불가분의 관계로 자리매김한 AI를 적극적으로 활용하여, 인간의 창의성과 생산성, 그리고 지식의 확장에 도움을 주는 것뿐 아니라, 생활에 편리함과 효율성을 제공하고자 한 포부를 드러내었습니다. 또한, 다차원적인 기술의 적용을 통해 혁신적인 경험을 제공하고자 하는 강한 의지를 내보였습니다.
구글은 과감하게 거대한 기술 변화의 시류에 탑승하여 AI 영역을 개척하고 확장하려는 동시에, 올바른 방향으로 AI의 발전을 강조하는 모습을 보여줌으로써 구글만의 사명을 엿볼 수 있었습니다.
이번 행사를 통해 많은 개발자를 포함한 사람들이 긍정적인 AI 생태계를 만들어 가기 위해 핵심적인 역할을 수행하길 바라며 글을 마무리하겠습니다.

더 자세한 내용을 알고 싶다면, 아래 영상을 확인하세요

(작성자 : 김하은)