아마존이 매년 12월에 개최하는 리인벤트(re:Invent) 행사는 아마존의 클라우드 서비스 방향과 새로운 기술 흐름, 기술을 기반으로 하는 새로운 전략을 알 수 있는 매우 중요한 행사이다. 이번에는 다른 회사들과 마찬가지로 온라인에서 가상으로 개최하는데 그 기간이 11월 30일에 AWS 최고경영자인 앤디 제시, 아마존의 CTO인 베르너 보겔스의 키노트를 시작으로 12월 18일까지, 그리고 다시 1월 12일부터 1월 14일까지 3 주의 기간 동안 이루어진다.
첫 날부터 머신 러닝 도구와 컨테이너에 대한 메이저 발표가 있었는데, 이 글에서는 인공지능과 머신 러닝을 중심으로 새롭게 발표한 내용을 살펴보기로 한다. 특히 이번 리인벤트에서는 처음으로 머신 러닝에 대한 키노트가 있었다. 아마존 인공지능 담당 부사장인 시와미 시바수브라마니안(Swami Sivasu-bramanian)이 발표한 이 발표를 통해서 아마존이 AWS에서 제공하는 새로운 인공지능 기능을 엿볼 수 있다(내용은 등록한 회원에게 우선 제공하고 있으며, 등록은 무료이다).
세이지메이커 업그레이드
아마존 AWS의 인공지능 영역의 핵심은 세이지메이커 플랫폼이다. 그동안 지속적으로 업그레이드 해 온 세이지메이커도 이번 리인벤트에서 여러 기능을 새로 공개했다. 세이지메이커 점프스타트 사용이 가능하다는 것을 발표했다. 이는 널리 알려진 모델을 모아서 원 클릭으로 접근할 수 있게 함으로써 머신 러닝 워크플로우가 매우 간편하게 이루어질 수 있도록 한 기능인데, 이를 세이지메이커 스튜디오와 통합을 했으며 다음과 같은 내용을 포함하고 있다. 15개 이상의 일반적인 머신 러닝 유스 케이스를 위한 엔드투엔드 솔루션. 여기에는 사기 탐지, 예측 유지 보수 등이 있다. 텐서플로우 허브와 파이토치 허브에 있는 150개 이상의 모델을 지원해 컴퓨터 비전, 자연어 처리 등을 하는 모델을 지원한다. 세이지메이커에 있는 내장된 알고리듬을 위한 샘플 노트북을 제공한다.
세이지메이커 파이프라인에 데브옵스 기능을 제공-머신 러닝 파이프라인을 종단 간으로 만들고, 자동화하고, 규모를 확장하는 것을 손쉽게 하기 위한 기능인 세이지메이커 파이프라인에 데브옵스 개념을 추가했다. 여기에는 세 가지의 구성 요소가 있는데 파이썬 SDK로 정의되며 세이지메이커의 어떤 오퍼레이션도 포함할 수 있는 파이프라인, 모델을 추적하고 목록화할 수 있는 모델 레지스트리(Model Registry), AWS 서비스 카탈로그를 통해 발행한 CI/CD 템플릿을 포함하고 자체의 템플릿을 추가할 수 있는 MLOps 템플릿이 있다. 파이프라인의 주요 특성으로는 머신 러닝 워크플로우를 구성, 관리, 재사용하는 기능, 제작으로 만들어질 배포용 모델 중 최선의 모델을 선택하는 기능, 그리고 모델을 자동으로 추적하는 기능, CI/CD 개념을 머신 러닝에 적용해 스케일업 할 수 있도록 하는 기능 등이 있다.
세이지메이커 피처 스토어를 새로 발표했다. 이는 세이지메이커의 새로운 기능으로 데이터 과학자나 머신 러닝 엔지니어가 학습과 예측 워크플로우에서 사용한 데이터를 저장, 발견, 공유할 수 있는 저장 공간이다. 이를 통해 많은 소스에서 온 데이터를 수집하고 특징을 저장할 수 있으며, 데이터 랭글러를 통해서 데이터 준비를 한 다음에 피처 스토어에 저장할 수 있다. 피처 스토어에서는 비쥬얼 인터페이스를 통해 특징을 태깅하거나 색인할 수 있으며, 특징 일관성을 보장하고, 특징 표준화를 만들 수 있다.
세이지메이커 데이터 랭글러(Data Wrangler)
세이지메이커 데이터 랭글러는 새로운 AWS 서비스로 머신 러닝과 인공지능 애플리케이션을 위해 데이터 준비 과정을 빠르게 하도록 지원하는 것이 목적이다. 데이터를 모으고 준비하는데 들어가는 시간이 몇 주 걸리던 것을 몇 분으로 바꿀 수 있다고 주장한다. 데이터 랭글러가 제공하는 기능은 다음과 같은 것이 있다.
- 데이터 선택 도구: 여러 개의 데이터 소스에서 빠르게 데이터를 선택할 수 있다. 데이터 소스는 아마존 S3, 애쓰나(Athena), 레드쉬프트, 레이크 포메이션, 세이지메이커 피처 스토어 등이 있다. 또한 쿼리를 이용해 여러 가지 파일 포맷에서 바로 세이지메이커로 데이터를 불러 올 수 있다.
- 데이터 변환 도구: 300개 이상의 사전에 설정된 데이터 변환 기능이 있는데, 본인 데이터를 코드 없이 바로 모델에서 효과적으로 사용할 수 있는 포맷으로 변환한다.
- 시각화를 이용해 데이터를 이해하기: 사전에 구성된 시각화 템플릿을 통해서 데이터의 잠재적 오류나 극단 값을 확인할 수 있게 해 준다.
- 데이터 준비 과정에서 불일치나 문제점을 빠르게 진단하고 고칠 수 있게 한다.
- 데이터 준비 워크폴로우를 자동화: 데이터 준비 워크플로우를 노트북이나 코드 스크립트로 바로 내보낼 수 있다, 이를 통해 세이지메이커 파이프라인과 통합할 수 있다.
세이지메이커 클러리파이(Clarify)
머신 러닝 개발자들에게 학습 데이터와 모델에 대해 편향이 있는지를 판별하고 예측에 대해 설명할 수 있는 기능을 제공하는 새로운 서비스이다. 데이터 준비 과정, 모델 학습 이후, 배포된 모델에서 우리가 명시한 속성을 검사해 잠재적 편향이 있는 지 확인한다. 예를 들어 초기 데이터셋이나 학습된 모델에서 나이에 관련한 편향이 있는지 체크하면 다른 유형의 가능한 편향에 대해 정량화한 상세 보고서를 받을 수 있다. 클러리파이의 편향 확인 기능은 크게 다음과 같은 것이 있다.
- 데이터에서 불균형 확인
- 훈련 모델에서의 편향 검사
- 편향에 관련된 모델 모니터링
또 하나의 큰 기능은 모델 행위에 대해 설명 능력인데, 이에는 모델에 대한 이해, 모델이 행위를 변경하는 것을 모니터링하는 기능, 개별적인 모델 예측에 대한 설명 기능이 있다. 예를 들어 훈련 모델이 어떤 요소를 다른 것에 비해 더 비중 있게 다루고 있는지 보여주거나, 실 세계 데이터의 변화가 시간에 따른 행위 변화를 어떻게 나타내는지 보여준다. 이는 기존의 세이지메이커 익스페리먼츠나 모델 모니터와 통합하면서 만들어진다. 이런 모델 예측에 대한 설명 기능은 현재 많이 강조하는 인공지능 투명성 문제에 대한 아마존의 첫 접근 방식으로 이해할 수 있다.
AWS 파노라마 디바이스 SDK
이번에 발표한 AWS 파노라마는 새로운 어플라이언스와 디바이스 SDK로 엣지 기기에서 컴퓨터 비전 서비스를 지원해 확장 가능한 생태계를 제공하고자 한다. 디바이스 SDK는 기기 제조업체가 AWS 파노라마 기능이 가능한 엣지 어플라이언스와 스마트 카메라를 개발할 수 있게 한다. 이를 통해 산업용, 제조업용, 노동자 안전, 로지스틱스, 운송, 리테일 분석, 스마트 빌딩, 스마트 시티와 같은 영역에서 인공지능 기능이 가능한 엣지 기기를 지원할 수 있도록 했다.
여기에는 클라우드와 엣지 기기 사이에 AWS 파노라마 서비스 오케스트레이션을 관리하는 코어 콘트롤러와 다양한 실리콘 플랫폼과 디바이스에서 파노라마를 가능하게 만드는 실리콘 추상화 레이어가 있다. 아마존은 이 기능을 위해 엔비디아 젯슨 제품군과 앰버렐라(Ambarella) CV 2x 제품 라인과 초기 파트너십을 맺었다고 발표했다.
그 외에도 액시스 커뮤니케이션, 애드링크 테크놀리지, 베이슬러 AG, 스탠리 시큐리티, 비보텍 등이 AWS 파노라마 지원 기기를 2021년에 개발할 것이라고 말했다. 이번에 발표한 세이지메이커 엣지 매니저도 엣지 디바이스에서 머신 러닝 모델 운영을 단순화하기 위한 기능을 제공하고 있다. 다시 말해, 엣지 기기에서 머신 러닝 모델의 최적화, 안전화, 모니터링, 유지를 위한 작업을 쉽게 만들어 준다.
AWS 트레이니움(Trainium)
AWS는 지난 2018년에 인퍼런시아라는 커스텀 머신 러닝 칩을 발표하고 이후 2019년에 이를 론칭 한 적이 있는데 이번에는 트레이니움이라는 칩을 소개했다. 인퍼런시아가 인퍼런스 가속 칩이라면 이번에 발표한 트레이니움은 머신 러닝 모델을 클라우드에서 학습시키는데 가장 가성비가 좋다는 특징이 있다. 이번 칩도 인퍼런시아처럼 AWS뉴런 SDK를 공유한다.
아마존 블로그에 따르면, 트레이니움 칩은 이미지 분류, 의미 검색, 번역, 음성 인식, 자연어 처리, 추천 엔진과 같은 애플리케이션을 위한 딥 러닝 학습 업무에 특히 최적화되어 있다고 한다. 머신 러닝 인프라 비용의 90% 이상은 인퍼런스 비용이 차지하지만 이 칩은 제한된 머신 러닝 학습 예산을 가진 팀을 위한 것이라고 설명하고 있다. 트레이니움은 아마존 EC2 인스턴스나 AWS 딥 러닝 AMI를 통해서 활용할 수 있으면 아마존 세이지메이커, ECS, EKS, AWS 배치와 같은 매니지드 서비스를 통해서도 사용할 수 있다. 트레이니움은 2021년에 공식으로 사용 가능해 질 것이다.
기타 머신 러닝과 관련된 새로운 기능
아마존 퀵사이트 큐(QuickSight Q)는 클라우드를 위한 비즈니스 인텔리전스 기능으로 자연어 질의어 기능을 같이 제공한다. 큐는 머신 러닝 알고리듬을 이용해 데이터 간의 관계를 이해하고 정확한 답을 제공하기 위해 색인을 구성한다. 사용자들은 퀵사이트 사용에 자연어를 이용해 데이터에 관한 질문을 할 수 있게 했다. 룩아웃 포 이큅먼트(Lookout for Equipment)는 센서 데이터를 분석해 장비 오류를 탐지하는 기능이다.
이는 API 기반 머신 러닝 서비스로 주로 발전기, 컴프레서, 풍력 터빈과 같은 산업용 기계에서 시간대별 이력 데이러와 과거 유지보수 이벤트 데이터를 가져와 가능한 조합을 테스트하고 장비의 정상 행동을 학습하는 머신 러닝 모델을 구축하게 한다. 이를 통해 고객이 장비의 비정상 행위를 탐지하도록 머신 러닝 인퍼런스를 쉽게 수행하도록 할 수 있다.
유사한 이름으로 룩아웃 포 비전(Lookout for Vision)도 발효했는데 이는 컴퓨터 비전을 이용한 시각적 표현에서의 오류를 찾아내는 서비스이다. 카메라를 통한 이미지를 확이낳고 해석하는 머신 러닝을 이용해 사람들이 일일이 확인하지 않더라도 품질 제어, 결함과 손상 평가, 컴플라이언스 등을 개선할 수 있도록 하고 있다. (그림 6)
아마존 모니트론(Monitron) 역시 산업용 기계에서 비정상 행위를 탐지하는 시스템이다. 이를 통해 예측 유지보수와 다운 타임을 줄일 수 있다. 모니트론은 기계에서 진동이나 온도 데이터를 센서를 통해 수집한다. 또한 이를 AWS로 안전하게 전달해 머신 러닝으로 분석하게 만드는 게이트웨이 기기 역할을 한다.
[divide style=”2″]
[box type=”note”]
본 글은 한국정보화진흥원의 지원을 받아 작성되었으며, 클라우드스토어 씨앗 이슈리포트에 동시 게재합니다.
[/box]