인공지능의 내일에는 눈과 입, 귀가 모인다 수업의 발견

전체상품목록 바로가기

본문 바로가기

현재 위치

홈
게시판
수업의 발견

수업의 발견

For Class 수업레시피

게시판 상세

제목

인공지능의 내일에는 눈과 입, 귀가 모인다

작성자

(ip:211.228.19.29)

평점
작성일 2022-12-08 17:29:32
추천 추천하기
조회수 25833

인공지능의 내일에는 눈과 입, 귀가 모인다

#인공지능 #기술 #혁명

AI 연구의 두 가지 큰 갈래

AI는 단어 그대로 사람의 지능을 흉내 낸 기술입니다. 더 엄밀하게 말하자면 살마처럼 스스로 생각하고 판단해 어떤 결과물을 만들어낼 수 있는 기술입니다. 하지만 지금의 기술로는 하나의 AI모델로 사람이 하는 모든 일을 할 수는 없습니다. 대신 특정 기능에 특화된 AI 모델들이 개발되고 있죠. 사람의 언어 기능을 본뜬 자연어 처리나, 시각 기능을 흉내낸 컴퓨터 비전이 대표적입니다.

지금까지는 주로 두 기능을 각각 발전시켜 AI를 만들었습니다. 우리 주변에서도 흔히 볼 수 있습니다. 여러 기업에서 내놓은 AI 스피커는 사람의 말을 듣고, 내뱉습니다. 자연어처리 AI모델에는 대표적으로 GPT-3가 있습니다. GPT-3을 활용한 영화 시나리오, 신문 기사 등을 인터넷 검색에서 쉽게 접할 수 있습니다.

한편 자율주행 AI는 사람의 눈을 대신한 센서로 실시간 상황을 판단하며 운전합니다. 이때 카메라나 라이다 같은 센서를 이용해 자동차 주변의 상황을 이미지로 만듭니다. 이를 분석해 도로 위에 어떤 장애물이 있는지, 사람이 지나가지는 않는지, 신호등은 어떤 색깔인지 등을 판단하고 운전을 하는 것이죠. 두 가지 기능은 지금까지 잘 통합되지 못했습니다. 박용범 단국대 소프트웨어학과 교수는 "각자 분야에서 사용하는 학습방법이나 데이터의 형태가 워낙 다른 것이 가장 큰 이유"라며 "컴퓨터 비전 기술은 자연어 처리보다 크게 발전해 있는 등 기술 수준도 다르다"고 말했습니다.

창작하는 AI가 등장한다

오늘 소개할 2905번 클러스터에는 자연어처리와 컴퓨터 비전을 더한 기능을 연구한 논문들이 포함돼 있습니다. 2905번 클러스터는 AI와 관련된 모든 클러스터 중에서 최근 5년 동안 발표된 논문 비중이 가장 높습니다. AI 연구가 2015년 알파고의 등장 이후 본격적으로 시작된 만큼 대부분 관련 논문은 최근 5년 이내에 발표됐습니다. 가장 뜨거운 관심을 받는 AI 중에서도 가장 높은 성장률을 보이는 점은 꽤나 주목할 만합니다.

2905번 클러스터에 속하는 논문이 늘어나는 만큼, 기술도 크게 발전했습니다. AI의 시각 질문 능력을 평가하는 대회인 VQA 챌린지의 결과에서 알 수 있습니다. 2021년 대회에서 1등의 점수는 80.78점입니다. 1등은 AI가 아닌 사람입니다. 2등인 AI 모델 '르네상스'는 79.78점입니다. 아주 근소한 차이라고 볼 수 있습니다. 세부적인 점수를 보면 AI 모델의 한계도 알 수 있습니다. '예/아니오'로 답하는 문제에서는 사람이 95.49점, 뒤를 이은 AI가 93.27점으로 큰 차이가 없습니다. 반면 숫자를 묻는 문제에서는 사람이 80.84점, 뒤를 이은 AI가 74.85점으로 큰 차이가 벌어집니다.

최근에는 사용자가 쓴 내용을 바탕으로 이미지를 만들어주는 '텍스트 투 이미지' 모델도 등장하고 있습니다. 인공지능 연구소인 오픈AI가 개발한 달리(DALL·E)가 대표적입니다. 최근 메타는 이를 뛰어 넘어 '텍스트 투 비디오' 모델인 '메이크 어 비디오'를 공개했습니다. 사용자가 쓴 내용으로 이미지 대신 엿아을 만들어줍니다. 이 모델들은 출시되자마자 세간의 주목을 받았습니다. 인간의 영역이라고 여겼던 '창작'이 더 이상은 인간의 전유물이 아니게 됐기 때문입니다.

눈과 입을 결합한 AI가 불러올 새로운 혁명

AI가 우리 생활 속에 들어온 지 꽤나 오랜 시간이 흘렀습니다. 그렇다면 자연어 처리와 컴퓨터 비전을 더한 새로운 AI로 할 수 있는 일은 무엇이 있을까요. 우선은 지금 쓰이는 AI모델의 기능을 가오하할 수 있습니다. 가령 자율주행을 위한 AI에 자연어 처리 기능까지 더한다면, 안전성을 높일 수 있습니다. 음성 없이도 이미지와 영상에 자막을 달 수도 있습니다. 마이크로소프트는 이 기술을 이용해 'Seeing AI'라는 애플리케이션을 개발했습니다. 스마트폰으로 사진을 찍으면 사람이나 제품, 장면을 음성으로 설명해줍니다. 시각장애인을 위해 개발됐습니다.

심리치료에도 활용될 수 있습니다. 미술치료 방법 중 하나인 '집-나무-사람 시험'처럼 평가자의 주관이 미치는 영향이 큰 경우에 잘 학습된 AI 모델이 필요합니다. 김남규 국민대 비즈니스IT전문대학원 교수는 "미술 치료사의 경험과 환경이 시험 결과를 해석하는 데 영향준다는 것은 환자들에게 매우 중요한 문제"라며 "전문가들의 해석 방법을 적용한 모델을 개발하면 신뢰성을 보다 높일 수 있을 것"이라고 설명합니다.

AI기술은 네 번째로 우리 삶에 혁명을 가져올 것으로 기대를 모으고 있습니다. 하지만 지금까지 AI의 눈과 입, 귀는 통합되지 못하고 있었죠. 통합은 이제 막 시작돼 새로운 영역에서도 AI를 만나게 해 줄 것입니다.

[출처] 과학동아_글 이병철 기자

AI의 새로운 변화

빠르게 발전하는 인공지능의 새로운 변화가 어떻게 우리의 일상에서 만나게 될 수 있을지 기대되지 않으신가요? 점점 발전하고 우리 일상에 가까워지고 있는 AI, SW 교육 단계에 맞춰 쉽고 재밌게 시작해보세요!

인공지능/코딩 교구 보러가기

신고 차단 차단해제

신고사유

관련없는 내용
욕설/비방
개인정보유출
광고/홍보글
기타

신고해주신 내용은 쇼핑몰 운영자의 검토 후 내부 운영 정책에 의해 처리가 진행됩니다.

신고 취소

첨부파일

수업의발견.jpg

비밀번호

삭제하려면 비밀번호를 입력하세요.

스팸신고 스팸해제 목록 삭제 수정 답변

댓글 입력

댓글달기 이름 : 비밀번호 : 비밀댓글관리자답변보기

영문 대소문자/숫자/특수문자 중 2가지 이상 조합, 10자~16자

확인

/ byte

왼쪽의 문자를 공백없이 입력하세요.(대소문자구분)

회원에게만 댓글 작성 권한이 있습니다.

이전글필름카메라의 무궁무진한 매력속으로
다음글실시간 LIVE 세포를 보는 현미경

법인명 : 주식회사 레드포인트 / 대표자 : 안태성
사업자등록번호 : 410-86-38371 [사업자정보확인] / 통신판매업 신고 제 2013-광주광산-0002호
전화 : 1544-8085 / 팩스 : 080-705-8085 / 본사 : 광주광역시 광산구 상완길 71 / 물류센터 : 광주광역시 북구 추암로 183 (한미전력) B동 레드포인트
기업부설연구소 : 광주광역시 남구 송암로 24번가길 46, 광주실감콘텐츠큐브 3층 304호
개인정보관리책임 : 박은정(redpoint80@naver.com) Hosting by 카페24

고객센터 1544-8085 오전 10:00~오후4:00 (점심시간 12:00~13:00) 토,일,공휴일은 휴무입니다.

예금주 주식회사 레드포인트 농협 351-0541-0995-03 / 국민 670701-04-097259

구매안전서비스

고객님은 안전거래를 위해 현금 등으로 결제시 저희 쇼핑몰이 가입한 PG에스크로 구매안전서비스를 이용하실 수 있습니다. 가입사실확인

PLEASE SELECT THE DESTINATION COUNTRY AND LANGUAGE :

쇼핑 카테고리

수업의 발견

게시글 신고하기

신고사유

구매안전서비스

WORLD SHIPPING