본문 바로가기

전체 글

AIaaS: 클라우드 AI 서비스 - 아마존, 마이크로소프트, 구글 개발자용 클라우드 AI 플랫폼 현황 AIaaS (AI as a Service) - AI와 클라우드의 만남 AIaaS, 즉 서비스형 AI는 인공지능을 클라우드에서 구현해 제공하는 서비스이다. 마켓 앤 마켓은 AIaaS는 2018년 15.2억 달러(1.82조 원)의 시장을 형성하였고, 연 평균 48% 성장해 2023년에는 108.8억 달러(13.05조 원)에 이를 것이며, AI가 퍼블릭 클라우드 서비스 전체 매출의 최대 50%를 차지할 것이라고 전망하였다. AI는 본질적으로 클라우드와 닿아있다. AI 서비스의 핵심은 컴퓨팅 리소스로, 수많은 학습 데이터를 저장할 공간, 모델 훈련 및 추론을 위한 고강도의 컴퓨팅 파워가 필요하기 때문이다. 이에 클라우드 시장의 빅 3 리더들인 아마존, 마이크로소프트, 구글은 A개발자용 클라우드 AI 서비스 시장.. 더보기
The Double Vocabulary of English - 영어에 '트윈' 단어들이 많은 이유는? "저녁엔 소고기 먹었어" 는 영어로 "I had cow🐮 for dinner" 가 아닌 "I had beef🥩 for dinner" 라고 한다. 같은 '소'를 표현하는 단어로 정원에 있는 소를 가리킬 때는 cow, 식탁 위의 소는 beef라고 부르는 것이다. 이처럼 영어에는 "쌍둥이 단어" 혹은 Double Vocabulary라고 불리는 특별한(?) 시스템이 있다. 쌍둥이 단어 체계의 기원을 알기 위해 5-7세기 경 영국으로 거슬러 올라가보자. 오랜 옛날, 오늘날의 영국 지역에는 켈트 족이 살고 있었다. 그런데 5세기 경 앵글로-색슨 족이 영국 땅을 침범하였고, 이들이 가져온 방언은 수 세기에 거쳐 영어의 기초를 형성하며 이전의 켈틱 언어를 대체했다. 앵글로 색슨이 가져온 언어는 현재 Old Englis.. 더보기
COVID-19: 코로나 19 데이터마이닝/ 분석용 데이터셋 (Kaggle) CORD-19: COVID-19 Open Research Dataset COVID-19 사태가 판데믹에 이름에 따라 미 백악관과 연구그룹이 연합하여 다음의 데이터를 공개함 - 44,000개의 학계 문헌들 > COVID-19, SARS-Cov-2 등 코로나 바이러스와 관련된 29,000 건의 텍스트 문서 포함 > NLP, AI 기술의 발전에 따라 이들을 활용해 새로운 인사이트를 찾을 수 있기를 기대하고 있음 과제 - 의료진의 과학적인 질문에 답할 수 있는 텍스트^ 데이터 마이닝 툴 개발 > 공개한 데이터는 코로나 바이러스와 관련된 방대한 문헌 집합으로, 특히 기계가 읽을 수 있다. > 이에 따라 AI 연구진들이 데이터&텍스트 마이닝을 통해 인사이트를 통합적으로 제공할 수 있기를 기대한다. - 특히 답변이 .. 더보기
TensorFlow Extended (TFX) - 프로덕션 레벨의 E2E 기계학습 파이프라인 플랫폼 / Cloud Google AI Pipelines TensorFlow Extended (TFX) " 전체 머신러닝 시스템을 정의하고 배포, 모니터링할 수 있는 일련의 요소를 모두 갖춘 TensorFlow 기반 머신러닝 플랫폼" - TFX의 목표는 구글에서 머신러닝 제품을 안정적으로 할 수 있는 플랫폼을 만드는 것이었음 - 따라서 TFX는 구글 프로덕트 수준의 scalability가 확보된 라이브러리라고 할 수 있음 (scalable production scale) - 구글의 software engineering + ML development 기술이 집약된 플랫폼 TFX 파이프라인 일련의 기계학습 태스크를 수행하기 위해서는 모델 정의부터 프로덕션 레벨의 문제까지 복잡한 문제들을 고려해야 함. - 데이터 준비 과정에서는 > 준비된 데이터의 통계량을 검진, .. 더보기
TensorFlow Lite - 모바일 & IoT 디바이스를 위한 딥러닝 프레임워크 TensorFlow Lite - 텐서플로우 모델을 모바일, 임베디드, IoT 환경에서 돌릴 수 있도록 도와주는 툴. - latency가 낮고, 작은 바이너리 사이즈로 작동하기 때문에 온 디바이스로 모델 추론이 가능함. 다음과 같은 니즈에 따라 엣지 디바이스에 대한 수요는 계속해서 증가하는 추세: - 네트워크 연결이 열악한 상황에서 레이턴시는 낮은 사용자 경험을 요구하고 있음 - 개인정보를 보호할 수 있어야 함 이에 따라 2017년, 구글은 머신러닝을 엣지에서 효율적으로 작동시킬 수 있도록 도와주는 TensorFlow Lite를 공개하였고, 처리 속도, 지원 디바이스, 개발 편의성 등의 측면에서 그 기능을 매년 강화하고 있다. 한 줄로 요약하자면, TensorFlow Lite는 Android, iOS, 리.. 더보기
완벽한 결혼 중매 💑: 게일-섀플리 알고리즘 / 잠정적 수락 알고리즘 / deferred acceptance algorithm ** 본 포스팅은 김민형 교수님 저, 의 5강 내용을 바탕으로 작성하였습니다. 잘 나가는 결혼 중매 회사가 되는 법? 갑자기 궁금해져서 듀x와 가x에서 연애 테스트(?)를 해봤당. 좋아하는 색깔, 비 올 때 기분이 좋은지 등 취향에서 시작해서 나의 학력, 키, 거주지, 연봉, 직업, 나이, 성별(?) 등을 물어보았고, 원하는 상대의 연봉, 키, 학력 등도 질문지에 있었다. 아마도 중매라는 것은 후보들의 교육수준, 집안, 재력, 외모뿐만 아니라 사회문화적인 요소들을 고려해 이루어지나 보다. 이 모든 것 들을 단순화해 생각한다면 다양한 조건들이 반영된 후보들의 '선호도'에 따라 중매를 해준다고 할 수 있겠다. 마음이 있는 사람들끼리 이어준다면? 그 중매는 굉장히 성공적일 것이다. 중매인의 룰 * 본 포스팅의.. 더보기
AutoML-Zero: 'zero' 에서부터 스스로 진화하는 기계학습 알고리즘 (2) AutoML-Zero: Evolving Machine Learning Algorithms From Scratch 휴먼 개입을 최소화 Evolution Search를 통해 backprop까지 스스로 발견한 기계학습 AutoML-Zero 알고리즘 개요 >> 2020/03/13 - [AI] - AutoML-Zero: 'zero' 에서부터 스스로 진화하는 기계학습 알고리즘 (1) 강화학습이 아타리게임의 트릭을 스스로 터득한 걸 봤을 때 느꼈던 놀라움이.... - 이러한 진화의 단계를 밟아가는 과정을 보면 진화 탐색이 랜덤서치보다 성능이 좋을 수밖에 없다는 것을 알 수 있다. 최종적으로 CIFAR-10의 테스트 셋에 대해 성능을 테스트해 보았을 때 - AutoML-Zero : 84.06% - 선형 모델 (logi.. 더보기
AutoML-Zero: 'zero' 에서부터 스스로 진화하는 기계학습 알고리즘 (1) AutoML-Zero: Evolving Machine Learning Algorithms From Scratch "우리의 목표는 AutoML이 한 걸음 더 나아갈 수 있음을 보여주는 것이다 - 이제는 기본적인 수학 연산을 기본 블록으로 하여 AutoML은 전체 기계학습 알고리즘을 자동으로 찾아낼 수 있다." 사람의 디자인을 최소화하고, 밑단부터 기계학습 알고리즘을 자동으로 탐색하는 방법을 제안한 논문 코드도 오픈소스로 공개해버림!! 논문 >> https://arxiv.org/pdf/2003.03384v1.pdf 코드 >> https://github.com/google-research/google-research/tree/master/automl_zero AutoML인데, 결국 사람이 디자인한 아키텍쳐에 .. 더보기