본문 바로가기

전체 글

Graph Convolutional Networks (GCN) 개념 / 정리 Graph Neural Networks (GNN) 복습 - Graph란 방향성이 있거나(directed) 없는(undirected) 엣지(edge)로 연결된 노드(nodes=verticles)들의 집합 - RNN을 이용해 인접한 노드의 정보를 취합하고, 그래프 전체를 하나의 representation으로 나타낼 수 있음 - 그래프 구조의 유연성으로 인해 자연적으로 그래프 형태를 가지는 소셜 네트워크 데이터, 분자 구조 등뿐만 아니라, 기존에 다른 형태로 표현되던 이미지 데이터 등도 그래프로 나타낼 수 있음 참고 >> 2020/03/10 - [AI] - Graph Neural Networks (GNN) / 그래프 뉴럴 네트워크 기초 개념 정리 Graph Neural Networks (GNN) / 그래프 뉴.. 더보기
Graph Neural Networks (GNN) / 그래프 뉴럴 네트워크 기초 개념 정리 그래프 뉴럴 네트워크는 그래프 구조에 대해 직접적으로 작동하는 뉴럴넷으로, 그래프 노드 사이의 상관성을 모델링한다. 따라서 그래프 분석(graph analysis)이 필요한 분야들 - ▲소셜 네트워크 분석, ▲ 추천 시스템 ▲ 지식 그래프 등에서 최근 인기가 높아지고 있다. 그래프 (graph)란? 그래프 G는 방향성이 있거나(directed) 없는(undirected) 엣지(edge)로 연결된 노드(nodes=verticles)들의 집합이다. 여기서 노드와 엣지는 일반적으로 풀고자 하는 문제에 대한 전문가의 지식이나 직관 등에 의해 구성된다. 예를 들어 분자 속 원자들, 소셜 네트워크의 사용자, 교통 시스템에서 도시들, 뇌에 있는 뉴런들 등 연구자가 그래프의 노드와 엣지를 정의할 수 있다. 그래프 뉴럴.. 더보기
하니웰, 3개월 이내에 최고 성능 양자컴퓨터 출시 예고 / Honeywell / 양자 컴퓨팅 개념 / 활용 분야 / 전망 양자 컴퓨팅, 구글 vs IBM 경쟁 구도인 줄 알았더니 조용히 기술을 연구해오던 회사가 있었음. 하니웰 퀀텀 컴퓨터 "세 달 안에 현재 유통되고 있는 양자컴퓨팅의 두 배 이상의 성능을 내는 제품을 출시하겠다" 3월 4일, 양자 컴퓨팅 상용화 실험에 조만간 착수한다고 발표 하니웰은 10년간 양자 컴퓨터의 기초 기술을 개발해왔고, 자사의 항공우주 및 재료 개발 사업에 양자 컴퓨팅 솔루션을 적용 중이라고 말함 최소 64 양자 용량을 갖는 컴퓨터 출시 예고 (IBM 최신 양자 컴퓨터는 32 양자 용량) JP 모건 체이스와 파트너 계약을 체결하여 금융 산업을 위한 새로운 알고리즘을 개발할 것 예고 구글, IBM이 사용하는 '초전도 큐비트'가 아닌 '갇힌 이온 큐비트'를 사용하고 있다고 전함 뿐만 아니라 양자 컴.. 더보기
코로나19 퇴치에 인공지능도 열일중 - 의료 AI / 진단 AI / 제약AI 빠르고 정확하게 - 진단 AI 알리바바, CT 영상으로 코로나 19 진단하는 AI 진단 시스템 현장 투입 - 진단 시간 20초, 96%의 정확도 - 목표는 코로나에 걸린 폐 CT와 일반 폐렴 이미지를 분류하는 것 - 중국 전역의 코로나 확진 자의 폐 CT 이미지 및 데이터 5000여 건을 수집하여 학습함 - 일주일간 30,000건의 폐렴 사례를 지원했고, 현재 중국 후베이, 상해, 광동 등 16개 지역의 26개 병원에 적용 중 중국에서는 코로나 확진에 CT의 임상 진단 결과를 활용하고 있다. 그런데 한 명의 폐렴 환자를 진단하기 위해서는 약 300장의 CT 이미지를 확인해야 하고, 이 과정에 15분가량의 시간이 걸려 의료진의 업무 부담이 큰 상황이다. 높은 정확도로 폐렴을 분류할 수 있는 AI 기술로 진.. 더보기
반도체가 뭘까? 반도체의 원리 / 8대 공정 정리 반도체 (Semiconductor) 일반적으로 전기적으로 도체와 부도체 사이의 성질을 띠고 있는 물질이라고 하나, 정확한 정의를 위해서는 에너지 띠(Energy Band) 와 금지 대역 또는 띠틈(Forbidden Zone/Band Gap)등 양자 역학적 개념이 필요하다. 대표적으로 탄소-규소-저마늄[1]으로 이어지는 14족의 물질들이 이에 해당하며, GaAs와 같이 13-15족 등 14족을 가운데로 하는 두 물질의 화합물도 이 성질을 갖는 경우가 있다. - 나무 위키 오늘부터 반도체 1일 하려 했는데 벌써 알고 싶지가 않아짐 ㅎㅎㅎㅎ 좀 더 쉽게 설명된 자료를 찾아보았다. ** 도움이 많이 많이 된 자료 출처🙏: https://www.skcareersjournal.com/194 https://www.s.. 더보기
[Python] IR 검색 알고리즘 - BM25 / 엘라스틱서치 랭킹 알고리즘 / 파이썬 rank_bm25 모듈로 문서 검색 구현하기 키워드 기반의 랭킹 알고리즘 - BM25 BM25(a.k.a Okapi BM25)는 주어진 쿼리에 대해 문서와의 연관성을 평가하는 랭킹 함수로 사용되는 알고리즘으로, TF-IDF 계열의 검색 알고리즘 중 SOTA 인 것으로 알려져 있다. IR 서비스를 제공하는 대표적인 기업인 엘라스틱서치에서도 ElasticSearch 5.0서부터 기본(default) 유사도 알고리즘으로 BM25 알고리즘을 채택하였다. BM25 step by step 살펴보기 BM25는 Bag-of-words 개념을 사용하여 쿼리에 있는 용어가 각각의 문서에 얼마나 자주 등장하는지를 평가한다. 키워드 q1,..., q_n을 포함하는 쿼리 Q가 주어질 때 문서 D에 대한 BM25 점수는 다음과 같이 구한다. 식은 복잡해 보이지만, 요소 하.. 더보기
페이스북 HiPlot : 딥러닝 하이퍼파라메터 탐색을 돕는 오픈소스 고차원 시각화 툴 HiPlot이란? - 고차원 상의 공간에서 상관관계와 패턴을 찾아낼 수 있도록 도와주는 대화형 시각화 툴 - 평행 좌표 플롯(parallel plot)을 비롯한 시각화 방법들을 이용해 정보를 명확하게 표현함 - 셋업 과정 없이 주피터 노트북에서 빠르게 실행할 수 있음 하이플롯은 하이퍼파라메터(hyper-parameter, 학습률, 정규화 등)가 미치는 영향을 쉽게 평가할 수 있도록 한다. 뿐만 아니라 데이터와 관련된 다양한 분야에서 데이터상에 존재하는 상관관계를 조사할 수 있도록 도와준다. Parallel Coordinate Plots - 다변량 데이터를 분석하고 시각화할 때 자주 사용하는 방법 - n차원의 공간을 n개의 수직 평행선으로 표현하고, 각각의 데이터 포인트를 폴리 라인으로 이어 나타냄 - 아.. 더보기
라빈 카프 알고리즘(Rabin-Karp Algorithm) : 해싱을 통해 효율적으로 문자열 검색하기 / 해싱 / 해시함수 해싱 (Hashing) 키 값에 직접적인 산술 연산을 적용하여 항목이 저장되어 있는 테이블의 주소를 계산해 항목에 접근하는 방법. 충분히 큰 공간을 할당한 다음 해시 함수를 이용해 고유 색인을 생성하고, 색인에 맞는 위치에 데이터를 저장하는 것이 특징이다. 해시함수 : 임의의 길이를 갖는 임의의 데이터를 고정된 길이의 데이터로 매핑하는 함수 해시 테이블 : 키 값의 연산에 의해 직접 접근이 가능한 구조 해싱 : 해시 테이블을 이용해 탐색하는 것 해싱에서는 자료를 저장하는 데 배열을 사용한다. 배열은 항목이 저장된 주소를 알고 있을 경우 빠르게 자료를 삽입하고 꺼내올 수 있기 때문이다. 배열에서의 삽입/ 접근에 대한 시간 복잡도는 O(1) 이다. 따라서 데이터를 색인으로 매핑하는 함수만 정의한다면, 이론적.. 더보기