AI Companion 미팅 & 채팅

접근성 및 협업 향상을 위한 AI 품질 우선 전략

테스트된 경쟁 제품 대비 Zoom AI Companion 2.0의 음성 인식 및 AI 생성 회의 인텔리전스 품질 경쟁 우위

업데이트 날짜 February 13, 2025

게시 날짜 November 14, 2024

접근성 및 협업 향상을 위한 AI 품질 우선 전략
Xuedong Huang
Xuedong Huang
최고 기술 책임자(CTO)

Xuedong Huang은 최고 기술 책임자(CTO)입니다. Zoom에 입사하기 전에는 Microsoft에서 Azure AI CTO 및 기술 펠로우로 근무했습니다. 1993년 Microsoft의 음성 기술 그룹을 시작하여 Microsoft의 AI 팀이 음성 인식, 기계 번역, 자연어 이해, 컴퓨터 비전 분야에서 업계 최초로 인간과 동등한 수준의 성과를 여러 차례 달성하도록 이끌었으며, IEEE 및 ACM 펠로우이자 National Academy of Engineering 및 American Academy of Arts and Sciences의 선출 회원으로 활동하는 등 AI 분야에서 화려한 경력을 보유하고 있습니다.

Xuedong은 1989년 University of Edinburgh에서 EE 박사 학위(영국 ORS 및 University of Edinburgh 장학금의 후원)를, 1984년 Tsinghua University에서 CS 석사 학위를, 1982년 Hunan University에서 CS 학사 학위를 취득했습니다.

기술은 공평한 기회를 제공하는 탁월한 도구가 될 수 있으며 인공 지능도 예외는 아닙니다. 인공 지능을 활용하면 이전에는 할 수 없었던 일을 성취하는 데 도움이 될 수 있습니다. Zoom AI Companion의 기능을 지속적으로 구축해 나가면서 Zoom은 당사 제품이 고객의 역량을 강화하는 데 어떻게 도움이 될 수 있는지 매우 신중하게 고민하고 있으며, 고객이 효율적이고 성공적인 업무를 수행할 수 있도록 최고 품질의 결과를 제공하기 위해 최선을 다하고 있습니다. 

고객들은 금융 서비스, 의료, 교육, 정부 등 다양한 산업 분야에서 AI Companion을 사용하고 있습니다. 오늘날 교육 업계 및 대학에서는 이미 학생과 교사가 강의 접근성을 개선하기 위해 Zoom의 AI 기능을 사용하고 있습니다. 의료 분야에서 사람들은 가상으로 진료를 받고 대화 내용 및 요약 기능을 사용하여 의료 서비스에 대한 접근성을 확대합니다. 

AI 기술을 통한 접근성 향상은 청각 장애인을 위한 선택 자막 제공에 국한되지 않으며, 언어 장벽 해소에도 기여하고 있습니다. 35년 전 스코틀랜드 에든버러에서 공부하며 영어를 배우던 시절, BBC 시청 시 제공된 선택 자막으로 도움을 받았을 뿐만 아니라 정확한 자막과 번역이 전 세계 사람들에게 어떤 도움이 될 수 있는지도 깨닫게 되었습니다. AI는 이미 상당히 광범위한 분야에서 활용되고 있으며, Zoom은 지속적으로 품질을 개선하여 더 많은 사람들에게 가능성을 제공하기 위해 노력하고 있습니다.

회의 대화 내용의 성공은 이러한 여정의 한 부분이며, AI를 통해 개인의 기술과 경험을 보강하여 더 큰 발전을 이루도록 돕는 방법에 대한 다양한 측면과 맞닿아 있습니다. 여기에는 회의나 웨비나에서의 실시간 자동 자막, 실시간 자막의 다국어 번역 또는 회의 요약, 스마트 녹화, 실행 항목 등을 위한 AI Companion의 회의 트랜스크라이브 기능이 포함될 수 있습니다. 글로벌 비즈니스 환경에서 보다 접근성 높고 공평한 회의 경험을 제공하면 모두에게 도움이 됩니다

Zoom AI Companion의 근간을 이루는 정확한 음성 인식 기능

올해 초, 저는 AI에 대한 Zoom의 통합적 접근 방식이 다른 AI 모델들에 비해 훨씬 적은 비용으로 동등하거나 더 나은 성과를 내고 있음을 공유했습니다. 오늘은 최근 TestDevLab에 의뢰한 Zoom AI 성능 평가 결과를 공유하게 되어 기쁘게 생각합니다. 이 평가는 Zoom AI Companion 2.0이 테스트된 다른 AI 도구들과 비교했을 때 음성 인식과 회의 인텔리전스 분야에서 선도적인 위치에 있음을 더욱 분명히 보여줍니다. 

Zoom AI Companion 2.0은 업무와 웹 정보를 원활하게 통합하여 Zoom Workplace 경험을 놀라운 수준으로 향상합니다. Zoom Workplace에 AI 기능을 통합하는 방법은 다양하지만 AI Companion의 특별한 측면은 회의 요약, 실행 항목, 대화 내용 등 가장 널리 사용되는 AI 기능을 지원한다는 점입니다.

이러한 AI 기능의 효과는 그 기반이 되는 대화 내용의 정확성에 달려 있습니다. 회의 중 질문과 같은 많은 인기 기능들은 고품질의 음성 인식을 활용합니다. 신뢰할 수 있는 대화 내용을 통해 AI는 이름, 주제 및 의도를 정확하게 파악하여 요약, 하이라이트, 실행 가능한 인사이트의 근간을 형성합니다.

대화 내용 정확도를 측정하는 업계 표준은 단어 오류율(WER)로, 이는 사람이 생성한 대화 내용과 AI가 생성한 대화 내용의 차이를 백분율로 비교한 값입니다. Zoom은 지난 몇 년간 AI 아키텍처를 첨단화하여 WER을 최소화하기 위해 노력해 왔습니다. WER을 최소화함으로써 Zoom은 정확하고 신뢰할 수 있는 대화 내용을 생성하여 고객이 효과적이고 실행 가능한 결과를 도출할 수 있도록 지원합니다.

WER 분석에서 빨간색 텍스트는 누락된 단어를 나타내고 파란색 텍스트는 소스 대화 내용에서 찾을 수 없는 단어를 나타냅니다.

WER 분석에서 빨간색 텍스트는 누락된 단어를 나타내고 파란색 텍스트는 소스 대화 내용에서 찾을 수 없는 단어를 나타냅니다. 

 

향상된 대화 내용 정확도를 통해 AI 기능을 강화하는 Zoom

결과는 분명했습니다. Zoom AI Companion은 훨씬 낮은 WER로 Microsoft Teams보다 훨씬 높은 수준의 대화 내용 정확도를 제공했습니다. 모든 단어가 중요한 회의에서는 사소한 대화 내용 기록 오류도 요약, 작업 또는 회의 중 제기된 질문에 대한 답변에 큰 영향을 미칠 수 있습니다.

TestDevLab이 이러한 테스트를 구축하고 실행한 방법은 다음과 같습니다.

  • 참가자가 2~16명인 3개의 회의 녹화를 사용했습니다.
  • 파일은 통화에 연결된 개별 컴퓨터에서 동시에 재생되었습니다.
  • 일관성을 위해 각 테스트를 각 플랫폼에 대해 5회 반복하여 실행했습니다.

각 테스트마다 Zoom Workplace와 Microsoft Teams를 비교하고 각 회의의 단어 오류율을 측정했습니다.

WER(단어 오류율) 측정 시 백분율이 낮을수록 대화 내용의 품질이 높다는 의미입니다.

WER(단어 오류율) 측정 시 백분율이 낮을수록 대화 내용의 품질이 높다는 의미입니다.

회의 요약 및 대화 내용은 여러 AI 플랫폼에서 가장 인기 있고 가장 많이 사용되는 기능 중 하나입니다. 워낙 널리 사용되기 때문에 오류를 최대한 줄이는 것이 더욱 중요합니다. 이러한 기능들은 시간을 절약해 주고, 중요한 정보를 읽고, 요약하고, 더 잘 이해하는 데 큰 가치를 제공하기 때문에 많은 인기를 얻고 있습니다.

TestDevLab은 또한 Zoom Workplace와 Microsoft Teams의 회의 요약 품질과 대화형 AI(예: 답변 안정성)를 평가하여 순위를 매겼습니다. 요약본을 평가하기 위해 사람이 직접 검증한 결과를 바탕으로 LLM 어시스턴트를 만들었습니다.

안정적인 대화 내용 기능을 통해 고품질의 다운스트림 AI 기능 토대 구축

TestDevLab이 측정한 AI Companion 기능은 대화 내용뿐만이 아닙니다. 대화 내용과 달리, 회의 요약과 같은 다른 AI 기능의 목표는 단어를 그대로 복사하는 것이 아니라 논의된 내용을 사용자의 기대치에 부합하도록 맞춤화하여 제공하는 것입니다. 

TestDevLab은 또한 Zoom Workplace와 Microsoft Teams의 회의 요약 품질과 대화형 AI(예: 답변 안정성)를 평가하여 순위를 매겼습니다. 요약본을 평가하기 위해 사람이 직접 검증한 결과를 바탕으로 LLM 어시스턴트를 만들었습니다.

이번 평가에서는 Teams 프리미엄 또는 Microsoft 365 Copilot 라이선스로 이용 가능한 지능형 요약 기능과 Teams Meetings에 제공되는 Microsoft Copilot AI 어시스턴트의 프롬프트 기반 요약 생성 기능 등 Microsoft Teams의 두 가지 요약 기능을 테스트했습니다. Copilot AI 어시스턴트는 프롬프트를 기반으로만 요약을 생성할 수 있기 때문에 회의가 끝나는 시점에 Copilot에게 요약과 실행 항목을 작성하도록 요청했습니다.

이번 평가에서는 Teams 프리미엄 또는 Microsoft 365 Copilot 라이선스로 이용 가능한 지능형 요약 기능과 Teams Meetings에 제공되는 Microsoft Copilot AI 어시스턴트의 프롬프트 기반 요약 생성 기능 등 Microsoft Teams의 두 가지 요약 기능을 테스트했습니다. Copilot AI 어시스턴트는 프롬프트를 기반으로만 요약을 생성할 수 있기 때문에 회의가 끝나는 시점에 Copilot에게 요약과 실행 항목을 작성하도록 요청했습니다.

대화형 AI의 경우, TestDevLab은 회의 중에 AI 플랫폼이 회의 내용과 관련된 질문뿐만 아니라 "세계에서 가장 높은 건물은 무엇인가요?"와 같은 관련 없는 웹 검색 질문에도 어떻게 응답하는지 측정했습니다. 응답 시간과 안정성(모든 회의 참가자에게 비슷한 답변을 제공하는 능력) 측면 모두에서 Zoom AI Companion이 Microsoft를 앞섰습니다.

안정성이 높다는 것은 Zoom의 AI가 모든 참가자에게 일관되게 신뢰할 수 있는 응답을 제공하여 회의 중 보다 원활한 경험을 제공한다는 것을 의미합니다.

안정성이 높다는 것은 Zoom의 AI가 모든 참가자에게 일관되게 신뢰할 수 있는 응답을 제공하여 회의 중 보다 원활한 경험을 제공한다는 것을 의미합니다. 

 

Zoom AI Companion을 통해 향상되고 공평한 회의 경험 제공

이러한 결과는 Zoom Workplace 및 AI Companion 전반의 품질에 대한 Zoom의 노력을 잘 보여줍니다. Zoom은 사람들이 서로 더욱 손쉽게 소통하고, 일상 업무의 효율성을 높이고, 인공 지능을 활용해 업무에 도움을 받을 수 있는 방법을 만들기 위해 노력하고 있습니다. AI가 생성한 회의 대화 내용은 청각 장애, 난청, 신경 다양성이 있는 사용자 및 회의에 참석한 사람들과 다른 언어를 사용하는 참석자를 포함하여 많은 사람들에게 보다 공평한 경험을 제공하기 위해 AI Companion을 사용할 수 있는 한 가지 방법일 뿐입니다.

TestDevLab이 실시한 이 평가에서 Zoom Workplace와 AI Companion은 테스트 대상 경쟁 제품 대비 뛰어난 대화 내용 기록 정확도, 빠른 회의 중 질문 응답 시간, 안정적인 대화형 AI 기능을 보여주며 AI 성능의 선두주자임을 입증했습니다.

또한 AI 기능을 사용하는 추가 사용자마다 추가 비용을 청구하는 일부 경쟁사 플랫폼과는 달리, Zoom Workplace는 유료 Zoom 계정에 추가 비용 없이 AI Companion을 제공합니다. Zoom은 이러한 정확하고 혁신적인 도구를 최대한 많은 고객이 사용할 수 있게 하는 것이 중요하다고 생각합니다. 고품질 대화 내용 생성이라는 기초부터 시작하여 모든 고객에게 탁월한 AI 경험을 제공하기 위해 지속적으로 노력하고 있습니다.

대상 유료 Zoom 요금제를 사용하고 있지 않다면, 지금 업그레이드하여 AI Companion의 혜택을 누리세요.

Zoom의 주요 고객

Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox
Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox

Zoom - 연결을 위한 하나의 플랫폼