본문 바로가기
BI/인공지능

Google 검색은 계속 발전한다

by wizmusa 2022. 8. 10.

구글 검색 서비스 수준은 누가 뭐래도 세계 제일이다. 물론 최근에는 몇몇 관점이나 주제로는 구글 검색의 대안을 자처하는 서비스가 나오고는 있다. 그러나 업력으로 따지면 구글은 워낙 압도적이다. 1998년 9월 이래로 쌓인 데이터는 다양한 고객 계층의 니즈를 파악하게 해 주었기에 어느새 구글은 '문서 검색'의 수준을 뛰어넘은 지 오래이다. 아직 공감대를 형성하지는 않았을 텐데, 이러한 구글의 지향은 대략 '증강 분석'이라는 용어로 설명이 가능하다.

증강 분석은 인공 지능(AI)과 기계 학습(ML)에 기반한 분석 유형으로, 상황에 맞추어 데이터와 상호 작용하는 인간의 능력을 확장하는 기술입니다. 증강 분석은 분석 기능을 더 많은 사람이 사용할 수 있게 하는 권장 사항, 인사이트, 쿼리 지침 등 다양한 도구와 소프트웨어로 구성됩니다. (출처: https://www.tableau.com/ko-kr/learn/articles/augmented-analytics)


구글 검색은 서비스 초기부터 검색어 입력란을 통해 다양한 도구를 제공하기는 했다. 단위 변환, 환율 변환, 계산기 같은 도구를 일일이 찾아 클릭하거나 파일명을 타이핑하여 실행하는 게 아니라, 다짜고짜 원하는 사항을 입력하면 사용자의 취지를 파악하여 부합하는 답을 검색 결과처럼 바로 보여주는 사용자 인터페이스는 처음 등장했을 때에 상당히 신선했다. 지금은 (이런 기능의 존재를 안다면) 다들 당연한 듯 쓰고 있긴 해도 처음에는 이런 발상이 가능하구나 하며 신기해 했다.

구글은 약정한 형식으로 물어보면 문서 검색결과가 아니라 답을 알려준다 - 세계시간 예시


언어에 따라 검색결과에 기계독해(Machine Reading Comprehension, MRC) 결과를 적용한 시점과 품질 수준이 달라 언제부터인지 잘은 모르겠으나, 구글은 한국어 자연어로 질문을 하면 답을 알려주려고 애를 쓴다. 몇 가지 실험을 했는데, 단순히 문자열을 유사어만 감안하여 검색한 결과를 보이는 게 아니라 질문하는 주제를 식별하는 수준은 된다. 때문에 동음이의어를 감안한 결과를 내보인다.

구글 검색에서 '우리나라에서 제일 오래된'이라고 입력한 예시


그러다 보니 검색엔진이 알아듣게 검색어를 구성하던 노하우가 발휘하던 효용이 많이 퇴색했다. 구글 검색 옵션(예: filetype)은 여전히 쓸모가 많지만 사람에게 묻듯 검색어를 넣어 얻는 검색 결과 역시 상당히 쓸 만한 수준에 올랐다. 게다가 검색어를 자연어 문장처럼 입력하다 보면 그 뒤에 올 만한(구글 검색 스스로 답하기에 자신 있다고 판단하는) 검색어를 추천한다.

'추천 스니펫'이라는 형태로 답을 제안한다. 그 하단은 일반적인 검색결과이다.


검색 결과는 기계독해를 거친 느낌이 나며(!) 꽤 괜찮은 편이긴 한데, 한국어 문서는 영문에 비해 많지 않아 간혹 얼토당토않게 신뢰성이 낮지 않을까 의심스러운 문서를 근거로 답을 한다. 그래도 주제를 구분할 줄 아니 맥락이 맞는 결과가 나오는 편이라 이전에 비해 검색에 들이는 시간이 확실히 줄어들었다.

중국문헌인 시경을 검색하겠다고 클릭하면 가수 '성시경'을 다룬 문서는 내보이지 않는 편이다.
단순히 특정 어휘만을 식별하는 게 아니라 그 어휘에서 파생한 어휘를 구분하는 걸로 보인다. 그래프 연산일까?
검색하려고 기입한 문자열이 'big data'일 때에 카테고리를 특정할 수 있게 돕기도 한다.


'big data'를 입력했을 때에 '빅 데이터' 주제인지 묻는다는 것은 여러 가능성을 추측하게 한다. 당장은 'big mart의 orange sales data' 같은 지엽적인 문서는 구글이 알아서 제해준다는 기대와 함께, 어느 언어든 '빅 데이터' 주제를 다룬 문서를 보여주는 게 가능함을 알 만하다. 더불어 구글이 꾸준히 추진해온 기계번역과 함께, 앞으로 'big data'든 '빅 데이터'든 검색하는 취지를 담은 문장으로 질문하듯 구글 검색에 입력하여 최선의 '답'을 얻을 수 있게 될 것이다. 이걸로 끝이 아니다.

구글은 아래 Google I/O 2022에서 발표했듯이 이미지, 영상, 음성을 복합적으로 활용하는 검색을 추구해왔다. PC, 스마트폰, 스마트 스피커, IPTV, 키오스크를 가리지 않는 정보검색의 채널로서 구글은 앞으로도 상당 기간 선두에서 물러날 일이 없어 보인다. 이 big player는 대체 무엇을 꿈꾸고 있을까? 제발 evil과는 거리를 두길 바란다.

Google I/O 2022 12분 요약 영상
반응형