IT/AI관련2024. 4. 23. 22:38

4월 17일(수)부터 4월 19일(금)일까지 COEX에 있었던 월드 IT 전시회를 다녀왔다. 몇몇 물어보고 살펴본 내용을 기록을 남겨봅니다.

World IT Show 2024
URL : https://www.worlditshow.co.kr/main/main.php

내용 목차
(1) 기술 용어 이해 
(2) 회사 소개 및 제품 소개
(3) 기술 및 관련 AI 알고리즘 이해
(4) 일상에서의 활용
(5) 군에서 활용 가능 예상 분야
(6) 뉴스 링크 및 관련 링크

 

(내용은 홈페이지와 기타 뉴스 등의 제공된 정보를 참고하였고, 또한 ChatGPT를 활용하여 작성하였습니다.)

 

회사 및 제품 
회사명 : OMNIS LABS 

 - 대용량 이미지 및 현미경 사진 분석을 하는 AI 모델을 코딩 없이 빠르게 만들어보기

링크 : https://www.deepblock.net/ko/

제품 : Deep Block - 가장 빠른 노코드 AI 플랫폼

 


(1) 기술 용어 이해 


 - API: API란 ‘응용 프로그래밍 인터페이스(Application Programming Interface)’의 줄임말로, 소프트웨어 간의 상호작용을 위한 규칙과 도구 모음입니다. 예를 들어 Deep Block의 API는 사용자가 자신의 소프트웨어아 시스템과 Deep Block 플랫폼을 연결할 수 있도록 해주는 도구입니다.

 - 클라우드: 인터넷을 통해 서버, 스토리지, 데이터베이스, 네트워킹과 같은 컴퓨팅 서비스를 제공하는 기술입니다. 이를 통해 사용자는 언제 어디서나 데이터에 접근하고 작업을 수행할 수 있습니다.

 

 



(2) 회사 소개 및 제품 소개


옴니스랩스 주식회사는 코딩 없이도 AI 모델을 학습시키고 배포할 수 있는 클라우드 플랫폼인 Deep Block을 개발했습니다. Deep Block은 사용자가 마우스 동작을 통해 데이터 전처리와 AI 모델 학습을 수행할 수 있게 하며, 특히 사물 인식에 강점을 가지고 있습니다. 이 플랫폼은 항공 사진이나 전자현미경 사진과 같은 고용량, 고해상도의 이미지에서 사물(객체)을 인식하는 데 사용될 수 있으며, 공간정보과학과 의료 영상 분석 등 다양한 분야에 적용 가능합니다. API 및 기업용 버전도 제공되어 다양한 기관 및 기업에서 쉽게 도입 및 활용할 수 있습니다.

 


Deep Block 제품 특징 

 - 거대한 크기의 정찰 위성 사진 신속 분석


  =>  Deep Block은 매일 수만 장 촬영되는 수십 GB 크기의 정찰 위성 사진을 신속하게 처리할 수 있는 기술을 제공합니다. 이를 통해 사용자는 지속적으로 변화하는 지상의 상황을 실시간으로 모니터링할 수 있습니다.


 - 공간 정보 이미지를 활용한 도시 관리 혁신 지원


  => Deep Block의 공간 정보 영상 분석 기술은 도시 계획 전문가들이 필요한 정보를 빠르게 추출하고 중요한 결정을 내릴 수 있도록 지원합니다. 이를 통해 인프라 관리, 도시 관리, 재난 대응 등의 중요한 과제에 대한 해결 효율성이 크게 향상


 - 나노 세계에서의 미세 변화 및 물체 탐지를 위한 고해상도 이미지 분석 기술


  => 초고해상도 현미경 이미지 분석을 통해 반도체, 나노소재 등의 작은 결함이나 변화를 정밀하게 탐지합니다. Deep Block의 최첨단 머신 비전 기술은 나노 머신과 재료과학 분야에서 발생할 수 있는 복잡한 문제들을 해결하는 데 필수적인 역할을 수행

 


 - 회사 홈페이지 정보에 따른 분석 솔루션의 성능


  => 10GP Pixcls (최대 이미지 파일 해상도) 처리, 
  => 40GB (최대 이미지 파일 크기), 
  => 10GB/sec(빠른 처리 시간), 
  => 성능 : 0.9 AP(높은 정확도), 0.9 Recall(예민한 감지 능력)


(3) 기술 및 관련 AI 알고리즘 이해

 

 - 딥러닝 
 - 기술 : Image Segmentation(객체 분할), Object detection(객체 인식), Change Detection(변화 감지)

 - Image Segmentation (객체 분할): 이는 이미지를 구성하는 여러 개체와 배경을 서로 구분하는 과정입니다. 이를 통해 시스템은 이미지의 구체적인 부분을 인식하고, 각 객체의 경계를 정확하게 식별할 수 있습니다.
 - Object Detection (객체 인식): 이미지 내에서 하나 이상의 객체를 탐지하고 위치를 식별하는 기술입니다. 이는 객체의 종류와 위치 정보를 제공하여 이미지 내의 중요한 객체를 추출하는 데 사용됩니다.
 - Change Detection (변화 감지): 두 개 이상의 시간대에 촬영된 이미지를 비교하여 시간의 흐름에 따른 변화를 식별하는 과정입니다. 이 기술은 특히 환경 모니터링, 도시 계획, 재난 감지 등에 유용하게 사용됩니다.


관련 논문 리스트


 - Object Detection and Image Segmentation with Deep Learning on Earth Observation Data: A Review—Part II: Applications (2023)
   (한글) 지구 관측 데이터에서의 딥러닝을 이용한 객체 탐지 및 이미지 분할에 관한 리뷰—응용 부분 (2023)

   요약 : 지구 관측 데이터에서의 딥러닝 기반 객체 탐지 및 이미지 분할에 대한 포괄적인 리뷰를 제공하며, CNN의 사용과 그 발전에 대해 설명합니다.
   URl : https://www.mdpi.com/2072-4292/12/18/3053

 - A Review of Deep-Learning Methods for Change Detection in Multispectral Remote Sensing Images (2023)
 (한글) 다중 스펙트럴 원격 감지 이미지에서 변화 감지를 위한 딥러닝 방법에 대한 리뷰 (2023)
   요약 : 다중 스펙트럴 원격 감지 이미지에서의 변화 감지를 위한 딥러닝 방법에 대해 리뷰하며, 최신 연구 동향과 기술적 도전을 다룹니다.
   URl : https://www.mdpi.com/2072-4292/15/8/2092

 - MTP: A Comprehensive Review of Modern Object Segmentation Approaches (2024)
 (한글) MTP: 현대 객체 분할 접근 방식에 대한 종합적인 리뷰 (2024)
   요약: 현대의 객체 분할 기법에 대한 종합적인 리뷰로, 여러 종류의 분할 작업과 기술적 접근 방식을 설명하고 있습니다.
   링크: https://arxiv.org/abs/2301.07499

 - A Survey of Modern Deep Learning based Object Detection Models (2024)
 (한글) 현대 딥러닝 기반 객체 탐지 모델에 대한 조사 (2024)
   요약: 현대 딥러닝 기반 객체 탐지 모델에 대한 조사로, 모델의 성능 평가 지표와 다양한 백본 아키텍처에 대해 논의합니다.
   URl : https://arxiv.org/abs/2104.11892


(4) 일상에서의 활용


Deep Block은 일상적인 응용 분야에서도 광범위하게 활용될 수 있습니다. 예를 들어, 부동산 업계에서는 대규모의 항공 사진을 사용하여 토지 이용 패턴을 분석하거나 개발 가능한 영역을 식별할 수 있습니다. 또한, 재난 대응 팀은 Deep Block을 활용하여 자연 재해 후의 영향을 평가하고, 피해 지역의 신속한 복구 계획을 수립할 수 있습니다. 일상적인 환경 모니터링에서도, 변화 감지 기능을 이용하여 환경 파괴 또는 불법 행위를 감지하고 대응할 수 있습니다.


(5) 군에서 활용 가능 예상 분야


국방 및 감시 분야에서 Deep Block의 기술은 특히 중요한 역할을 할 수 있습니다. 예를 들어, 군은 Deep Block을 사용하여 적의 움직임을 감시하거나 전략적인 지역의 변화를 실시간으로 분석할 수 있습니다. 또한, 무인 항공기에서 촬영한 영상을 분석하여 적의 기지, 장비, 병력의 위치를 파악하고, 작전 계획을 세울 때 중요한 정보를 제공받을 수 있습니다. Deep Block의 빠른 처리 능력은 정보 수집의 지연을 최소화하며, 신속한 의사 결정을 가능하게 합니다.

 


(6) 뉴스 링크 및 관련 링크


https://pulsenews.co.kr/view.php?year=2023&no=354398

(뉴스 내용 번역)
옴니스랩스는 자체 머신러닝 AI 플랫폼 딥블록(Deep Block)을 통해 비행기, 드론, 위성 등에서 수집한 영상 데이터를 손쉽게 분석하는 기술을 개발했다. 위성이나 항공기에서 촬영한 영상은 최대 100테라바이트에 달하는 대용량으로 분석이 쉽지 않지만, 회사의 AI 플랫폼을 활용하면 초당 최대 15기가바이트의 위성 및 항공영상 데이터를 자동화할 수 있다. 회사는 싱가포르 정부의 지원을 받아 공간정보 분석 시장이 빠르게 성장하고 있는 싱가포르 시장을 주목하고 있다.

(위의 내용의 일부분은 주어진 정보를 토대로 생성 AI를 이용하였습니다. 생성 AI의 약점으로 인한 틀린 부분이나 추가 내용, 변경이 필요한 내용이 있다면 댓글로 남겨주시면 반영하도록 하겠습니다.)

Posted by 예영교육 연구소
IT/AI관련2024. 4. 22. 14:32

 

4월 17일(수)부터 4월 19일(금)일까지 COEX에 있었던 월드 IT 전시회를 다녀왔다. 몇몇 물어보고 살펴본 내용을 기록을 남겨봅니다.

World IT Show 2024
URL : https://www.worlditshow.co.kr/main/main.php

 

 

내용 목차


(1) 용어 이해 - LiDAR, SaaS 기반, 클라우드, AIoT
(2) 제품 및 기술 내용
(3) AI 알고리즘 기술 이해
(4) 일상에서의 활용
(5) 군에서 활용 가능 예상 분야
(6) 뉴스 링크 및 관련 링크

 

 

 

회사 및 제품 
회사명 : WATA 
링크 : https://watanow.com/web/landing.do?lang=en

제품 : AI 창고 물류 관리 플랫폼

AI로 생성한 이미지

 

(1) 용어 이해 

 

LiDAR : LiDAR (Light Detection and Ranging)는 빛을 발사하여 반사파의 시간차를 측정해 거리를 계산하고 3차원 공간 정보를 수집하는 원격 센싱 기술로 수집된 데이터를 활용하여 3D 모델을 생성하거나, 맵을 만드는 데 사용됩니다.

SaaS 기반 : SaaS (Software as a Service) 기반은 인터넷을 통해 소프트웨어를 구독 형태로 제공받아 사용하는 서비스 모델을 말합니다. 사용자는 소프트웨어를 직접 설치하거나 관리할 필요 없이 서비스를 이용할 수 있습니다.

클라우드 : 인터넷을 통해 가상화된 컴퓨터 시스템 자원(스토리지, 서버, 네트워크 등)을 제공하고 필요 시 실시간으로 활용할 수 있는 서비스입니다.

AIoT : AI(인공지능)와 IoT(사물인터넷)의 합성어로, 사물인터넷 기기에 인공지능 기술을 접목하여 데이터를 수집, 분석, 활용하는 기술을 의미합니다.

(2) 제품 및 기술 내용 

 

제공된 제품 소개와 특징에 따르면, WATA의 AI 창고물류 관리 플랫폼은 다양한 첨단 기술을 통합하여 물류 산업의 디지털 변혁을 지원합니다. 이 플랫폼은 LiDAR, Vision, AIoT, 엣지서버를 융합한 AI Vision Kit를 사용하여 실시간으로 물류 데이터를 수집하고 분석합니다. 이 기술은 지게차에 설치되어 현장에서 직접 물류의 크기, 중량, 형상을 측정하고, 이 정보를 플랫폼에 전송하여 입출고 과정을 자동화합니다.

이 플랫폼은 기존에 데이터 수집과 처리에서 제한적이었던 시스템을 대체하며, 실시간 현장 데이터를 기반으로 한 실질적이고 효율적인 물류 처리를 가능하게 합니다. 또한, 플랫폼은 작업차량의 실시간 위치 추적과 작업 상황을 중계하여 작업의 효율성을 개선하고 산업재해 예방에 기여합니다.

 


(3) AI 알고리즘 기술 이해

 

기술 : LiDAR, 공간 인공지능 기술, 딥러닝, 객체 인식 및 객체 추적, AIoT

관련 논문 리스트
"LiDAR-Based 3D Object Detection from Monocular Images: A Semi-Supervised Learning Approach"(2021)
요약: 이 논문은 단일 카메라 영상에서 LiDAR 데이터를 활용하여 3D 객체 검출을 수행하는 준지도 학습 방법을 제안합니다. 이를 통해 실제 LiDAR 데이터 없이도 3D 객체 검출이 가능해집니다.
링크: https://arxiv.org/abs/2107.10886

"Spatial AI for Last-Mile Delivery: Towards Efficient Warehouse Operations"(2022)
요약: 이 논문은 공간 인공지능 기술을 활용하여 라스트마일 배송과 창고 운영의 효율성을 높이는 방안을 다룹니다. 센서 데이터 기반의 공간 매핑, 경로 최적화, 재고 관리 등의 기술을 제시합니다.
링크: https://arxiv.org/abs/2202.12336

"Deep Learning for Vision-Based Robotic Grasping: Recent Progress and New Frontiers"(2021)
요약: 이 논문은 비전 기반 로봇 그리핑(grasping) 분야에서의 최근 딥러닝 연구 동향과 미래 과제에 대해 개괄합니다. 객체 인식, 그립 포인트 예측, 시각-운동 통합 등의 주제를 다룹니다.
링크: https://arxiv.org/abs/2102.10094

"3D LiDAR-Camera Fusion for Accurate Object Detection and Tracking"(2022)
요약: LiDAR와 카메라 센서의 융합을 통해 3D 공간에서 객체 검출 및 추적 성능을 향상시키는 기술에 대해 설명합니다. 데이터 퓨전, 3D 바운딩 박스 예측 등의 방법론을 제시합니다.
링크: https://arxiv.org/abs/2205.07584

"Federated Learning for Intelligent Warehousing and Logistics"(2021)
요약: 이 논문은 창고 및 물류 분야에서 연합학습 기술의 활용 방안에 대해 논의합니다. 데이터 프라이버시를 보호하면서 다양한 물류 데이터를 활용하여 인공지능 모델을 학습하는 방법을 설명합니다.
링크: https://arxiv.org/abs/2107.08085

 


(4) 일상에서의 활용

 


WATA의 AI 창고물류 관리 플랫폼은 물류 산업 전반에 걸쳐 활용될 수 있습니다. 특히 대형 유통센터나 전자상거래 물류센터에서 이 기술을 도입하면 효율성과 정확성이 크게 향상될 것입니다.

실시간으로 입출고 데이터를 수집하고 관리할 수 있어 재고 불일치 문제를 해결할 수 있습니다. 또한 자동화된 업무 프로세스로 인해 인력 운영의 효율성이 높아지고 휴먼 에러를 최소화할 수 있습니다.

이 플랫폼은 개인 사용자들의 일상적인 배송 서비스 향상에도 기여할 수 있습니다. 정확하고 실시간의 재고 관리를 통해 제품 배송 지연을 줄일 수 있고, 라스트마일 배송의 효율화로 신속한 배송이 가능해집니다.

 


(5) 군에서 활용 가능 예상 분야

 


군사 분야에서는 WATA의 기술이 광범위하게 활용될 수 있습니다.

특히, 군수품과 장비의 관리, 물자의 신속한 배치 및 회수, 위험 물품의 안전한 취급 등에 이 기술이 사용될 수 있습니다. LiDAR와 AIoT 기술을 활용한 실시간 위치 추적과 자동화된 재고 관리 시스템은 군의 물류 작업을 보다 정확하고 효율적으로 만들어, 전술적 운영의 개선을 도모할 수 있습니다.

군에서는 다양한 군수 물자를 실시간으로 추적하고 관리해야 하는데, 이 플랫폼을 통해 통합적이고 자동화된 관리가 가능해집니다. 전시 상황에서 신속하고 정확한 물자 보급은 필수적입니다. 이 기술을 활용하면 실시간 데이터를 기반으로 물자의 위치와 상태를 파악할 수 있어 보급 지연을 방지할 수 있습니다.

 


(6) 뉴스 링크 및 관련 링크

 


와따 (WATA), CES에서 2년 연속 혁신상 수상(2022.11.23 출처 : 이데일리)
URL : https://www.edaily.co.kr/news/read?newsId=02663366632528672

[CES 유레카관] WATA·BTE·PABLO '빛났다'...코트라 역할 '톡톡'(출처 : 유튜브)
https://www.youtube.com/watch?v=LwRLL8u-jf8 

 

(일부 내용은 ChatGPT 4.0, Claude, Google Gemini를 참고했습니다. 틀린 부분이나 추가적인 기타 내용은 댓글로 남겨 주시기를 바랍니다.)

Posted by 예영교육 연구소
IT/AI관련2024. 4. 20. 22:26

World IT Show 2024

URL : https://www.worlditshow.co.kr/main/main.php

 

내용 목차


(1) 제품 및 기술 내용
(2) AI 알고리즘 기술 이해
(3) 일상에서의 활용
(4) 군에서 활용 가능 예상 분야
(5) 뉴스 링크 및 관련 링크

 

 

회사 및 제품 


회사명 : 딥인스펙터 (AI활용 인프라 시설 안전 점검 회사)
링크 : https://deepinspection.ai/

 

제품 : 구독형(SaaS) 딥인스펙터

 


(1) 제품 및 기술 내용 


딥인스펙션은 인공지능 기반 안전점검 솔루션을 제공하는 기업으로 다음과 같은 기술을 가지고 있다고 소개합니다.

 - 인공지능 모델: 수백만 장의 결함 이미지로 학습된 인공지능 모델은 90% 이상의 정확도로 균열 및 결함을 자동으로 검출합니다. (공인기관 시험성적서 기준)
 - 딥러닝 플랫폼: 한국전자통신연구원(ETRI)의 분산 딥러닝 플랫폼 기술을 활용하여 경쟁사 대비 5배 이상 경제적인 솔루션을 제공합니다.
 - 이동식 촬영장치: 자체 개발한 이동식 촬영장치(Deep Scanner) 또는 상용 드론으로 데이터를 수집하여 안전한 작업 환경을 제공합니다.
 - 인공지능 소프트웨어: 인공지능 소프트웨어로 영상을 처리하여 균열 및 결함을 정량화하고, 외관조사망도(도면)를 자동 생성합니다.
 - SaaS형 구독 서비스: Deep Inspector는 SaaS형 구독 서비스로, 월 구독료 100만원부터 시작합니다.

 


(2) AI 알고리즘 기술 이해

관련 뉴스에 따르면 다음과 같은 기술을 가지고 있다고  합니다.
 - 기술 : XAI(eXplainable AI)와 Deep Booster
 - 딥러닝 이미지 분류 
  (A) XAI는 설명 가능한 인공지능
   AI모델은 어떤 근거로 판단하는지에 대한 부분이 있었고, 오류를 파악하고 개선하기가 어려웠습니다. 그리고 문제가 발생했을 때, 책임소재를 명확하게 파악하기 어려운 부분이 있었습니다. 따라서 XAI의 기술이 등장했습니다.

 XAI는 AI의 결정 과정을 투명하게 만들어 사용자가 AI가 내린 결정의 이유를 이해할 수 있도록 돕습니다. XAI는 각 결정에 대한 근거를 제공함으로써 신뢰성을 높이고, 오류를 줄이며, 사용자의 수용성을 향상시킬 수 있습니다.

  (B) Deep Booster는 인공지능 모델 학습을 위해 개발된 솔루션
     - 한국전자통신연구원(ETRI)의 '분산 딥러닝 플랫폼 기술'을 활용해 개발한 솔루션.
     - 다수의 컴퓨터 자원을 활용하여 딥러닝 모델의 학습 속도를 향상시킨다. 
     - 주요 특징
        -- 분산 학습 : 여러 컴퓨팅 자원을 동시에 활용하여 대규모 데이터셋에 대한 학습을 빠르게 처리합니다.
        -- 효율성 향상 : 기존의 단일 시스템보다 더 많은 데이터를 처리할 수 있습니다. (모델의 정확성과 효율성을 증가)

관련 논문 리스트
 - Explainable AI: current status and future directions - (2021)
   요약 : XAI의 필요성을 강조하며, 특히 공정성, 신뢰성, 투명성을 보장하기 위해 다양한 분야에서 XAI의 적용 범위를 탐색합니다. 이 논문은 의료, 방위, 금융 등 여러 분야에서 XAI의 중요성을 설명합니다.
   URl : https://arxiv.org/abs/2107.07045

 - 'XAI Handbook: Towards a Unified Framework for Explainable AI' (2021)
   요약 : XAI의 현재 상태와 미래 방향에 대한 개요를 제공합니다. XAI는 분류나 객체 감지와 같은 특정 솔루션을 어떻게 얻었는지 설명할 수 있습니다. 다양한 도메인에서 XAI의 기여를 체계적으로 검토합니다.
   URL : https://arxiv.org/pdf/2105.06677.pdf

 - "A Survey on Explainable Artificial Intelligence" (2022)
   요약: XAI의 정의, 목적, 중요성, 다양한 XAI 접근 방식 및 도구, XAI 평가 방법 등을 포괄적으로 논의합니다.
   링크: https://arxiv.org/pdf/2210.05173

 - "Explainable AI: A Methodological Review" (2023)
   요약: XAI 연구의 최신 동향, 주요 방법론, 평가 지표, 미래 전망 등을 종합적으로 검토합니다.
   링크: https://arxiv.org/pdf/2305.12167


(3) 일상에서의 활용


 딥인스펙션 기술은 다음과 같은 일상 분야에 활용되고 있습니다. 그리고 다음과 같은 분야의 활용 가능성이 있습니다.

 - 건설: 건설 현장에서 딥인스펙션을 사용하여 콘크리트 균열, 철근 노출, 용접 결함 등을 검출할 수 있습니다.
     -> 현대 건설과 교량 및 건축시설물에 대한 PoC를 완료한바 있음. 현대엔지니어링과 건축시설물에 대한 공동연구 진행.
     -> 2024년 글로벌 시장 진출을 위해 유럽 시장 개척중.

 - 교통: 도로, 교량, 터널 등의 교통 인프라를 딥인스펙션을 사용하여 안전 점검할 수 있습니다.
 - 에너지: 송전선, 발전소, 풍력 터빈 등의 에너지 인프라를 딥인스펙션을 사용하여 안전 점검할 수 있습니다.
 - 건축: 건축물의 외벽, 지붕, 창문 등을 딥인스펙션을 사용하여 결함을 검출할 수 있습니다.

 


(4) 군에서 활용 가능 예상 분야

 


  - 시설물 안전 점검
    - 군 기지, 훈련 시설, 병사 숙소 등의 시설물을 안전하게 점검하는 데 활용될 수 있습니다.
    - 딥인스펙션은 인공지능 모델을 사용하여 균열, 부식, 결함 등을 자동으로 검출하여 인력 부족 문제를 해결하고 안전 사고를 예방하는 데 도움을 줄 수 있습니다.
    - 특히, 위험한 환경이나 접근하기 어려운 곳에 위치한 시설물의 안전 점검에 효과적입니다.

 


(5) 뉴스 링크 및 관련 링크


 딥인스펙션, "초대형 시설 AI 점검..디지털 재해예방 확산"(머니투데이)
  - https://news.mt.co.kr/mtview.php?no=2023092017035795091

 

(일부 내용은 ChatGPT 4.0, Claude, Google Gemini를 참고했습니다. 틀린 부분이 있다면 댓글로 남겨 주시기를 바랍니다.)

Posted by 예영교육 연구소
IT/AI관련2024. 4. 20. 01:08

 

4월 17일(수)부터 4월 19일(금)일까지 COEX에 있었던 월드 IT 전시회를 다녀왔다. 몇몇 물어보고 살펴본 내용을 기록을 남겨봅니다.

World IT Show 2024
URL : https://www.worlditshow.co.kr/main/main.php

 

IT전시회 World IT Show

국내 최대 규모 IT전시회 4월 코엑스 개최

www.worlditshow.co.kr

 

(박람회 전시 광고 참조)

 

목차

(1) 제품 및 기술 내용

(2) AI 알고리즘 기술 이해

(3) 일상에서의 활용

(4) 군에서 활용 가능 예상 분야

(5) 뉴스 링크

 

(1) 제품 및 기술 내용

회사의 제품 소개

클리카는 AI 모델을 작고 가벼운 모델로 만들어주는 특별한 솔루션.

간편한 3단계의 자동 모델 경량화-컴파일링 솔루션

  1. 먼저 내 컴퓨터나 스마트폰 같은 기기와 원하는 모델 크기를 정합니다.
  2. 그 다음 변환하고 싶은 AI 모델을 업로드합니다.
  3. 마지막으로 클리카 솔루션을 실행하면 알아서 모델을 가볍게 만들어줍니다.

 

제품 특징

  • 분류(Classification), 객체 인식(Object Detection) 등의 시각 지능 인공지능 모든 분야에서 글로벌 Top 타 솔루션(메타 PyTorch 및 엔비디아 TensorRT)대비 월등한 성능을 도출
  • 인공지능 경량화 > 시각화 > 배포 > 디바이스 관리/업데이트의 올인원(all-in-one)플랫폼을 제공.

(제품 소개 및 제품 특징은 Click의 내용 참조)

 

(2) AI 알고리즘 기술 이해

클리카의 핵심 기술은 모델 경량화 및 컴파일링 알고리즘입니다. 이는 대규모 AI 모델을 작은 메모리 및 컴퓨팅 자원으로도 동작할 수 있도록 최적화하는 기술입니다.

 

(3) 일상에서의 활용

경량화된 AI 모델은 스마트폰, 태블릿, 로봇, 자율주행차, 드론 등 다양한 모바일 및 임베디드 기기에 탑재될 수 있습니다. 이를 통해 실시간 물체 인식, 자연어 처리, 이미지 분석 등 지능형 서비스가 가능해집니다. 예를 들어 스마트폰에서 실시간 번역, 사진 내 물체 검출 등의 서비스를 이용할 수 있습니다.

 

(4) 군에서 활용 가능 예상 분야

군에서도 경량 AI 기술을 다양하게 활용할 수 있습니다. 첫째, 드론, 로봇, 센서 등 스마트 무기체계에 경량 AI 모델을 탑재하여 지능형 감시, 표적 식별, 자율 운용 기능을 구현할 수 있습니다. 둘째, 전술 정보체계에 자연어 처리, 영상 분석 AI를 탑재하여 데이터 처리 및 의사결정 지원이 가능해집니다. 셋째, 증강현실 기술과 결합하여 지능형 전술훈련체계를 구축할 수 있습니다.

 

(5) 뉴스 링크

[K-스타트업의 도약 ⑭] 클리카 “세계최고 초소형머신러닝 기술 보유” (에너지 경제 신문 : 22/10/23)

https://m.ekn.kr/view.php?key=20221023010003356

Posted by 예영교육 연구소
IT/AI관련2024. 4. 13. 01:13

 

목차

- 01. 군에서 신호 정보 데이터에는 어떤 것들이 있을까?
- 02. 위의 신호 정보 데이터는 어떤 목적으로 활용되고 있을까?
- 03. 인공지능(AI) 기술은 어떻게 사용되고 있을까?

 

 

01. 군에서 신호 정보 데이터에는 어떤 것들이 있을까?

 

 

01. 군에서 신호 정보 데이터에는 어떤 것들이 있을까?
군사 분야에서의 신호 정보 데이터(Signal Intelligence, SIGINT)는 주로 통신 및 전자 신호 수집을 통해 얻어지는 정보를 포함한다.

   A. 통신 정보(COMINT) : 통신 정보는 무선 통신을 통해 전송되는 모든 종류의 음성, 텍스트 및 데이터 신호를 포함.
     - 음성 통신 : 전화 통화, 무선 통화, 인터넷 음성 통화 등
     - 텍스트 통신 : SMS, 이메일, 채팅 메시지, 소셜 미디어 게시물 등
     - 데이터 통신 : 파일 전송, 인터넷 트래픽, 군사 시스템 데이터 등

    ===> 대화 내용이나 메시지를 해석하고 해당 정보에서 중요한 전략적 또는 전술적 데이터를 추출하는 데 중점을 둔다.

    ===> 분석 방법 
     - 음성 인식 : 음성 통화 내용을 자동으로 텍스트로 변환하고 분석.
     - 텍스트 분석 : 메시지 내용을 분석하여 주요 키워드, 개념, 의도 등을 파악.
     - 데이터 분석 : 파일 내용, 인터넷 트래픽 패턴 등을 분석하여 정보를 추출.

    ===> 활용 방식
     - 적군의 의도 및 계획 파악 : 통신 내용을 분석하여 적군의 군사 작전 의도, 계획, 및 병력 배치 상황을 파악
     - 사기 및 속임수 작전 : 위조된 통신 메시지를 보내 적군을 속이고 혼란시키는 데 활용.


   B. 전자 정보(ELINT) : 전자 정보는 주로 비통신 전자 신호를 포함.
    - 레이더 신호 : 적군 레이더 시스템에서 발사되는 신호
    - 유도 시스템 신호 : 적군 미사일, 유도탄 등에서 발사되는 신호
    - 무기 시스템 신호 : 적군 무기 발사 시 발생하는 신호
    - 통신 신호 분석 : 통신 신호의 특성을 분석하여 정보를 추출

    ===> 분석 방법 
     - 신호 분석 : 전자 신호의 주파수, 강도, 패턴 등을 분석하여 정보를 추출
     - 이미지 처리 : 레이더 영상 등을 분석하여 적군의 위치, 이동 방향, 군사력 등을 파악
     - 신호 모의 : 적군 전자 시스템의 작동 방식을 모의하여 취약점을 파악

    ===> 활용 방식
     - 적군의 위치 및 이동 파악 : 레이더 신호를 분석하여 적군의 위치, 이동 방향, 군사력 등을 파악
     - 적군 무기 시스템 분석 : 무기 시스템 신호를 분석하여 적군 무기의 종류, 성능, 운영 방식 등을 파악
     - 적군 통신 시스템 분석 : 통신 신호 분석을 통해 적군 통신 시스템의 취약점을 파악하고 공격 전략을 수립

    ===> ELINT는 적의 레이더 위치, 유형, 기능을 식별하고 적의 방공 시스템, 항법 시스템 등의 기능과 활동을 분석하는 데 사용.

   C. 계기 신호(FISINT) : 계기 신호는 적의 시험과 운용 중인 무기 시스템에서 발생하는 신호를 포함.
     - 미사일 발사 신호 : 적군 미사일 발사 시 발생하는 신호.
     - 위성 추적 신호 : 적군 위성의 궤도 및 활동을 추적하는 신호.
     - 우주 활동 신호 : 적군의 우주선 발사 및 운용 관련 신호.
     - 핵 실험 신호 : 적군 핵 실험 시 발생하는 신호.


    - 미사일 발사, 위성 추적, 우주 활동
    ===> FISINT는 주로 적의 무기 개발 상태와 능력을 평가하는 데 사용.

   D. 기타 신호 정보 데이터 
     - 사이버 정보(CYBINT) : 적군의 컴퓨터 네트워크 및 시스템에서 탈취한 정보
     - 사회공학 정보(SOCINT) : 적군의 인원, 조직, 활동 등에 대한 정보를 수집하기 위해 일반 대중이나 적군 인원을 대상으로 하는 정보
     - 오픈 소스 정보(OSINT) : 인터넷, 뉴스 기사, 소셜 미디어 등 공개적으로 입수 가능한 정보

 

 

 

02. 신호 정보 데이터는 어떤 목적으로 활용되고 있을까?

 

  A. 적군의 의도 및 계획 파악 : 수집된 신호 정보 데이터를 분석하여 적군의 군사 작전 의도, 계획, 및 병력 배치 상황을 파악합니다.
  B. 전장 상황 감시 : 적군의 이동, 군사력 배치, 활동 등을 지속적으로 감시하고 전장 상황을 파악합니다.
  C. 미션 수행 지원 : 공격, 정찰, 방어 등 다양한 군사 작전을 수행하는 데 필요한 정보를 제공합니다.

 

 

 

03. 인공지능(AI) 기술은 어떻게 사용되고 있을까?

 

3-1 사이버 공격 방어
  A. 사이버 공격 감지 및 차단 : 새로운 공격 패턴을 빠르게 학습하고 대응. 네트워트 트래픽을 분석하고 침입 시도를 식별하여 사이버 공격으로부터 군사 시스템을 보호.
  
  B. 패턴 분석 : 공격자의 행동 패턴을 분석하여 새로운 공격 방법을 예측하고 이에 맞는 방어 전략을 수립하는데 도움을 준다.
    (예) AI는 데이터 패턴을 학습하여 평소와 다른 비정상적인 신호 패턴을 식별할 수 있습니다. 예를 들어 적의 새로운 통신 프로토콜이나 암호화 방식을 식별하는데 유용하게 사용될 수 있습니다.

   사용될 수 있는 인공지능 알고리즘 :

    B-1 머신러닝 분류 알고리즘 : 의사결정나무, 랜덤 포레스트, 신경망 등

    B-2 군집 분석 알고리즘(Clustering Algorithms) : 유사한 특성을 가진 데이터 포인트들을 그룹으로 묶어 분석하는데 사용. 비슷한 신호 패턴을 가진 데이터를 집단화하여 새로운 통신 프로토콜의 특성을 식별할 때 유용. K-평균(K-means)과 계층적 클러스터링이 사용될 수 있음.

    B-3 시계열 예측 알고리즘(Time Series Forecasting Algorithms) : ARIMA과 LSTM(Long Short-Term Memory)네트워크와 같은 알고리즘을 이용하여 패턴을 학습 후, 미래의 데이터 포인터를 예측하는데 사용. 이는 적의 통신 활동의 주기를 파악하고 예측하는 사용될 수 있음.

 

 

3-2 전자 정찰 데이터 분석
  A. 적군의 통신 내용, 레이더 신호, 소나 신호, 광학 신호 등을 분석하여 적군의 의도, 계획, 군사력 등을 파악합니다.

    A-1 자연어 이해(Natural Language Understanding, NLU) : 텍스트에서 의도나 의미를 추론하는 기술. 딥러닝과 변경기 기반의 모델을 활용하여 문맥적 이해를 통해 적의 의도나 계획을 분석하는데 사용. 예를 들어 GPT(Generative Pre-trained Transformer)와 같은 모델은 복잡한 언어 구조와 의미를 이해하는 데 강력합니다.

   A-2 감정 분석(Sentiment Analysis) : 텍스트에서 감정을 탐지하는 NLP기술로, 통신 내용의 긴장감, 긴급성 등을 평가할 수 있습니다.  적용 예: 적군의 긴급 통신을 식별하고, 특정 상황이나 위협에 대한 반응을 분석하여 적의 심리 상태나 긴급 상황을 파악합니다.

 


  B. 적군의 레이더 및 소나 신호를 분석하여 적군의 위치, 이동 방향, 군사력 등을 파악하고 공격 목표를 선정하는 데 도움을 줍니다.

  B-1 잠수함 탐지 및 추적 : 잠수함과 같은 수중 목표물을 식별하고 추적하는데 사용.

    방법: 소나 신호를 분석하여 특정 패턴을 인식함으로써 잠수함의 형태, 크기, 속도 및 이동 방향을 파악합니다. 이 정보는 잠수함의 위치를 추적하고, 잠재적인 위협을 평가하는 데 기초 자료로 사용

    (1) 데이터 수집 및 전처리 : 소나 시스템으로부터 수집된 음파 신호 데이터는 노이즈 제거, 신호 강화, 필터링 등의 전처리 과정을 거칩니다.

    (2) 특징 추출 : 딥러닝 모델 (예: 컨볼루션 신경망, CNN)을 사용하여 소나 데이터로부터 잠수함의 특징을 자동으로 추출합니다. 이 모델들은 이미지 인식 분야에서 널리 사용되는 기술로, 소나 이미지에서 잠수함의 형태, 크기 등을 식별하는 데 적합

    (3) 객체 탐지 및 분류 : 특징 추출된 데이터는 객체 탐지 알고리즘을 통해 잠수함과 같은 목표물을 식별합니다. 여기에는 YOLO(You Only Look Once), SSD(Single Shot MultiBox Detector) 등의 실시간 객체 탐지 모델이 사용될 수 있습니다. 이 알고리즘들은 빠른 처리 속도와 높은 정확도로 실시간 추적에 유용.

    (4) 패턴 인식 및 행동 분석 : 순환 신경망(RNN) 또는 LSTM과 같은 모델을 사용하여 시간에 따른 잠수함의 이동 패턴을 분석합니다. 이는 잠수함의 이동 경로, 속도 및 방향을 예측하는 데 사용되며, 잠수함의 향후 위치를 예측할 수 있게 합니다.


3-3 음성 인식 AI
  A. 음성 인식 AI : 적군의 통신 내용을 자동으로 분석하여 중요 정보를 빠르게 추출
   A-1 자동 음성 인식 (Automatic Speech Recognition, ASR) : 음성 데이터를 텍스트로 변환하는 기술

          딥러닝 기반 모델 LSTM, RNN, Transformer) 모델, BERT기반의 모델 사용.

   A-2 음성 합성(Text-to-Speech, TTS) : 텍스트를 음성 데이터로 변환하는 기술. 전사된 메시지를 원어민처럼 들리게 하는데 사용. (예 : WaveNet, Tacotron과 같은 모델)

   

  B. 실시간 분석 및 위협 감지 : 수집된 신호 정보 데이터를 실시간으로 분석하여 위협을 신속하게 감지하고 대응하는데 도움을 준다.

   
  
3-4 통신 신호 처리 
  A. AI는 통신 신호의 해석과 최적화에 사용됩니다. 예를 들어, 무선 네트워크에서는 AI를 사용하여 신호 간섭을 줄이고 데이터 전송률을 향상시킬 수 있습니다. 또한, 신호의 질을 자동으로 감지하고 조정하여 효율적인 데이터 전송을 보장.
   A-1 [통신네트워크 최적화] CNN과 순환신경망(RNN)이 통신 신호의 특징을 학습하여 간섭을 줄이고, 신호 품질을 자동으로 조절. 이는 데이터 전송률을 최적화하고, 네트워크 용량을 개선하는 데 기여.

   A-2 [통신네트워크 최적화] 오토인코더(Autoencoders): 신호의 손실을 최소화하면서 데이터를 압축하고 복원하는 데 사용됩니다.


  B. AI는 음성 신호를 분석하여 음성 인식, 음성 번역, 음성에서 텍스트로의 변환 등에 널리 사용됩니다. 이 기술은 스마트폰, 스마트 스피커, 고객 서비스 자동화 시스템 등에서 핵심적인 역할.

3-5 신호 분류
  A. 레이더, 소나, 통신신호 등의 신호를 분류하고 식별하는데 도움.

      예를 들어 무선 통신, 레이더 신호 등 다양한 형태의 신호를 실시간으로 감지하고, 이들 신호가 민간인의 것인지, 아니면 적의 군사 활동과 관련된 것인지 구분.

3-6 스펙트럼 관리 및 최적화
  A. 머신러닝 기법으로 가용 주파수 스펙트럼을 효율적으로 할당하고 전파간섭을 최소화.

     A-1 강화학습(Reinforcement Learning, RL) : 동적 환경에서의 최적의 결정을 내리는데 사용됩니다. 스펙트럼 사용 패턴을 학습하여 실시간으로 가용 주파수를 할당하고, 간섭을 최소화하는 전략을 개발합니다. 

     ( 대표 알고리즘: Q-learning, Deep Q-Networks(DQN), Proximal Policy Optimization(PPO))

     

 

  B. 동적 스펙트럼 접근 기법을 통해 주파수 자원을 최적화.
     B-1 코그너티브 라디오 기술과 결합된 AI

      구현: 코그너티브 라디오는 환경을 ‘인지’하여 가용 스펙트럼을 찾고, AI는 이 데이터를 기반으로 최적의 주파수 할당 전략을 수립합니다. (미국 국방부 : DARPA(Defense Advanced Research Projects Agency)는 이전에 Spectrum Collaboration Challenge(SC2)라는 대회를 주최했었습니다. 이 대회는 코그너티브 라디오 기술을 사용하여 무선 스펙트럼을 더 효율적으로 사용하는 방법을 찾는 것을 목표 했었음)

 


3-7 의사결정 지원
  A. 실시간 센서데이터와 AI 기반 예측을 활용하여 작전 지휘관의 의사결정을 지원.
  B. 기존 체계보다 신속하고 정확한 상황 판단이 가능해짐.

 

### 기타 활용 사례 관련 기사

영국 육군, 국방 훈련에 최초로 AI도입(21.07.07)

============================================

영국 최초 실탄 사격 훈련에 AI 엔진 활용
마이크로소프트, 미 육군에 AR 헤드셋 12만 대 제공
프랑스, AI 로봇 개 '스팟(spot)' 군사훈련에 투입
국내 ‘국방 인공지능 TF' 조직, 지능형 정보시스템 구축

============================================

https://www.aitimes.com/news/articleView.html?idxno=139397

 

전파기술의 AI적용 동향 및 전망

간단 요약 : 현재 전파 기술에 AI를 적용하는 필요성과 그 방법, 주요 동향 및 표준화 동향을 설명하고 있습니다. AI 기술은 스펙트럼 공유, 불법 전파 탐지, 레이다 탐지, 전파 의료영상, 채널 모델 등 전파기술의 다양한 분야에서 활용되고 있습니다.

https://ettrends.etri.re.kr/ettrends/185/0905185006/35-5_69-82.pdf

 

음성 인식 AI 

차세대 항전 통합 플랫폼 (ADEX 2021에 공개된 차세대 항공전자 통합 플랫폼!)

음성 대화형 인터페이스 및 3D 음향 기술

https://www.youtube.com/watch?v=nTq8IgyUkEk

 

미래 전쟁의 핵심... 미중 AI무인무기 개발 경쟁(2023.09)

https://www.youtube.com/watch?app=desktop&v=LDVGHL-sFmo

 

DOD Releases AI Adoption Strategy

https://www.defense.gov/News/News-Stories/Article/Article/3578219/dod-releases-ai-adoption-strategy/

 

[간단 내용 요약]

AI 채택 가속화: 미국 국방부는 전장에서의 결정 우위를 유지하기 위해 AI 기능의 채택을 가속화하는 전략을 발표했습니다.
전략의 초점: 이 전략은 AI를 책임감 있고 신속하게 통합하는 것에 중점을 두고 있으며, 결정의 속도와 정확성을 향상시키는 데 도움이 됩니다.
지속적인 우위 확보: 새로운 전략은 DOD가 미래에도 AI 기능을 계속 활용할 수 있는 기반을 제공합니다.

 

 

(위의 내용중 일부 내용 AI ChatGPT, Gemini, Claude를 활용한 참고하여 작성한 내용입니다. 오류나 정정이 필요한 부분이 있다면 댓글로 남겨주세요.)

Posted by 예영교육 연구소
IT/AI관련2024. 4. 4. 22:32

케라스에서 다음과 같이 우리는 간단한 신경망을 구축할 수 있다.

 

from keras.models import Sequential

from keras.layers import Dense

import numpy as np

 

# 모델 구성

model = Sequential()

model.add(Dense(8, activation='relu', input_dim=3)) # 입력 3차원, 은닉층 8유닛, ReLU 활성화

model.add(Dense(3, activation='softmax')) # 출력층 3유닛, 소프트맥스 활성화 (이진 분류)

 

모델은 다음과 같은 신경망을 구성한다.

입력층(3개 노드), 출력층(3개 노드), 은닉층(8개노드), bias 없음.

 

여기에서 기본적으로 프로그램에서는 bias 노드가 포함된다. bias는 일반적인 신경망에 포함이 된다. 프로그램으로 bias노드를 포함시키지 않으려면 다음과 같이 하면 된다.( use_bias=False )

 

model = Sequential()

model.add(Dense(8, activation='relu', input_dim=3 , use_bias=False )) # bias 제외

model.add(Dense(3, activation='softmax' , use_bias= False  )) # 출력층 3유닛, 시그모이드 활성화 (이진 분류)

 

다음과 같이 신경망이 만들어진다.

입력층(3개 노드), 출력층(3개 노드), 은닉층(8개노드), bias 없음.

 

 

bias에 유무에 대한 장단점과 관련 논문을 좀 더 다양한 내용을 찾아서 정리해 봅니다.

===============================================

Bias의 역할
 - 01. Keras에서는 model.add(Dense())에서 기본적으로 옵션을 설정하지 않으면 bias가 포함된 신경망이 된다.
 - 02. 제시된 많은 연구와 논문에 따르면 일반적으로 Bias가 포함된 신경망이 모델의 성능이 개선된다고 한다. 하지만, 모든 신경망이 그렇다는 것은 아니다.
 - 03. bias의 장단점
    bias의 장점 : 
     A. 복잡한 패턴도 학습이 가능해져, 학습 능력의 향상과 더 많은 것들을 표현할 수 있다.(일반적으로 모델 성능 향상)
        - 일반적인 신경망 모델에서는 bias가 있는 것이 보편적이다.
     B. Bias를 통해 모델의 표현력이 향상되어 복잡한 비선형함수를 학습할 수 있다.
     C. 출력층의 Bias로 경계를 쉽게 조정할 수 있어, 분류 성능이 향상될 수 있다.

    bias의 단점 : 
     A. 신경망에 Bias 항이 포함되어, 모델의 파라미터 수가 늘어난다. 모델의 복잡도가 커진다.
         - bias가 없는 경우가 유리할 때는 없애는 것이 좋다.
         - bias가 없는 경우, 모델의 파라미터 수를 줄게 되어 계산 효율성과 일반화 성능을 높일 수 있다.
     B. 네트워크 복잡성의 증가로 학습 속도가 느려질 수 있다.
     C. 때때로 모델의 성능에 부정적인 영향을 주는 경우도 있다.
     D. 출력층이 선형 함수 만을 다루는 회귀 문제에서는 bias가 불 필요할 수 있다.

=================================================
참고 자료(논문)
Revealing Model Biases: Assessing Deep Neural Networks via Recovered Sample Analysis (2023)
 - 심층 신경망의 모델 bias를 평가하는 새로운 방법을 제안하고, 이를 통해 모델의 잠재적 bias를 밝히고 있음.

Scalar Invariant Networks with Zero Bias (2022)
 - bias 없이 설계된 스칼라 불변 네트워크에 대해 논하며, 이러한 접근 방식이 모델 성능에 미치는 영향을 분석.
 - 스칼라 불변 네트워크는 bias 항을 사용하지 않고 설계되어 일반적 신경망 모델과 동일하거나 더 나은 성능을 보임.

"Do We Need Bias in Neural Network Models?" (Assaad et al., 2022)
 - 다양한 신경망 모델에서 bias 유무에 따른 성능 변화를 실험적으로 분석한 논문.
 - 대부분의 모델에서 bias 항의 존재가 모델 성능을 향상시켰음을 보였습니다.(특정 데이터셋과 모델에)

"What is being transferred in transfer learning?" (Bao et al., 2021)
 - 전이학습에서 bias 항의 역할.
 - 연구에서는 bias가 중요한 역할을 했다고 함.

"Understanding the role of bias in deep neural networks" (Deleu et al., 2020)
 - 딥러닝 모델의 bias 항 역할에 대해 이론적, 실험적으로 분석.

 "Do we need bias in convolutional neural networks?" (Avrutskiy et al., 2022)
 - CNN에서 bias 포함 여부에 따른 성능 변화를 비교.
 - 이 연구는 bias를 포함하는 것이 유리하다고 제시.

Bias Also Matters: Bias Attribution for Deep Neural Network Explanation (2019)
 - 심층 신경망의 설명에 있어 bias의 중요성을 다루며, 모델의 해석과 이해를 돕는 중요한 요소로 밝힘.

A Bias Neural Network Based on Knowledge Distillation (2018)
 - 지식 증류를 기반으로 한 bias 신경망을 탐구하며, 이를 통해 모델의 성능 향상을 실현할 수 있음을 보여줌.

Role of biases in neural network models (1997)
 - 신경망 모델에서 bias의 기본적인 역할에 대해 강조하며, 이는 모델의 정확도와 유연성 향상에 기여.

An empirical investigation of bias and variance in time series forecasting: modeling considerations and  error evaluation (2003)
 - 시계열 예측에서 bias와 분산의 영향을 실증적으로 조사하여 bias가 예측 정확도에 중요한 영향을 미친다는 것을 제시.

The role of biases in on-line learning of two-layer networks (1998)
 - 온라인 학습, 특히 두 층 네트워크에서 bias의 중요성을 조사하며, 이는 학습 과정과 결과를 향상.

 

--- 정리
일반적인 신경망은 bias가 포함되고, 일반적인 성능의 개선을 가져오고 있다. 다만, 모든 신경망과 모든 데이터에서 그런 것은 아니다. 때때로 경우에 따라 bias가 포함되지 않아도 동일한 성능을 가질 수 있다.

 

Posted by 예영교육 연구소
IT/AI관련2023. 9. 20. 01:02
스테이블 디퓨전 Webui 구글 코랩 설치하기
(write date : 2023/09/19)
 
이글은 저자의 판단상 초보 개발자를 지향하는 이들을 대상으로 작성되었습니다. 궁금한 것은 댓글로 남겨주세요.
그래서 구글 기본 가입 및 기본적인 내용은 없을 수 있습니다. 다만, 댓글로 남겨주시면, 추후 관련 내용 링크를 참조에 넣도록 하겠습니다.
 

학습 목표

가.  스테이블 디퓨전이 무엇인지 간단히 이해하기
나.  스테이블 디퓨전 기본 이해
다.  스테이블 디퓨전 구글 코랩 설치해 보기
 
목차
 
1-1 스테이블 디퓨전 기본 이해
1-2 사전 환경 확인
1-3 스테이블 디퓨전 웹 사이트 방문
1-4 구글 코랩 설치하기
1-5 간단한 스테이블 디퓨전 사용해보기
이번 시간에는 스테이블 디퓨전 WEBUI를 구글에 설치해 보는 것을 진행해 보겠습니다.
이번 시간의 목표는 간단하게 설치해 보는 것이 목표이기에 초보자에 대상의 기본 이론만 간단히 설명하고 넘어가겠습니다.
 

1-1 스테이블 디퓨전 기본 이해

 
스테이블 디퓨전은 텍스트를 입력하면 AI가 자동으로 이미지를 생성해 주는 것이다. 중요한 점은 무료 사용이 가능합니다.
 
2022년 8월 22일에 공개한 인공지능 모델입니다.
독일 뭔헨 대학교 Machine Vision & Learning Group(CompVis)연구실의 연구를 기반으로 Stability AI와 Runway ML 등의 지원을 받아 개발된 인공지능 모델입니다.
Stable Diffusion AI개발을 위해 사용된 비용은 약 $600,000정도로 추정된다고 합니다.
 
 
비슷한 모델로 OpenAI의 Dall-e 2나 구글의 Imagen과 같은 기존의 모델에 비해 컴퓨터 사용 리소스를 대폭 줄여 4GB 이하로 VRAM을 가진 컴퓨터에서 돌릴 수 있습니다.
 
2022년 8월 2일 1.0버전 출시
2022년 11월 24일 2.0 버전 발표
 

1-2 사전 환경 확인

  • 구글 코랩 사용을 위해서는 구글 계정 가입이 필요합니다.
  • 이번 설치는 구글 코랩을 이용합니다. 23/09/09월 기준으로  무료로 코랩을 이용하는 것을 제한을 하여 이를 위해 코랩 Pro($9.99)의 결제가 필요합니다. 의도적으로 막은 것이 아닐까 생각해 봅니다...
 
 

1-3 스테이블 디퓨전 웹 사이트 방문

 
(A) 스테이블 디퓨전 설치 github 저장소로 이동
 
스테이블 디퓨전(Stable Diffusion)은 오픈소스입니다. 따라서 누구나 무료 수정 및 사용이 가능합니다. 단, 초보자분들은 이를 설치해서 사용하는 것이 쉽지 않아, 설치 부분을 해결해 준 것이 바로 아래 Stable Diffusion Web UI입니다.
 
 

 
 
(그림 1-3-1 스테이블 디퓨전  webui 저장소)
접속 후, 마우스 스크롤을 아래로 내리면 다음 내용이 확인됩니다. 구글 코랩 설치이므로 List of Online Services를 선택합니다.
 
 

 

구글 코랩에 대해서도 설명이 아래 나와 있습니다. 의도적으로 사용을 제한했다...
 
 
구글 코랩의 어떤 것을 설치해도 상관이 없습니다. 단 맨 처음이 일반적으로 안정된 버전이 많아 보여, 첫번째 항목으로 선택합니다.
 
 

1-4 구글 코랩 설치하기

이제 구글 코랩 환경에서 설치를 하기 위한 준비가 되었습니다. 먼저 유료 계정으로 가입된 계정으로 로그인을 하고 난 이후에 아래 작업을 진행해 주세요.
설명을 보니 무료 계정은 구글에서 가끔 아예 계정을 막는 그런 정책을 한다고 합니다.ㅠㅠ
Drive로 복사를 눌러 내 컴퓨터 환경에서 설치를 진행해야 합니다.
 

(그림 1-4-1 Drive로 복사 선택)
 
이후 설치 환경은 일반 CPU가 아닌 GPU에서  GPU를 연결합니다.  기본적으로 GPU가 선택되어 있습니다.
방법 1 : 연결 GPU 선택

 

방법 2 : 런타임 -> 런타임 유형 변경 -> T4선택
 
방법 1

 
(그림 1-4-2 GPU연결)
 
방법2

 
 
(그림 1-4-3 GPU연결)
 
GPU를 연결 후, 아래 순서에 따라 하나씩 작업을 진행합니다.
 
 
 

(그림 1-4-4 설치 진행)
 
01  Connect Google Drive : 나의 구글 드라이브에 연결합니다.
 

 

 
 

 

 
(그림 1-4-5 구글 드라이브 연결)

 

 
 
설치가 완료되면 아래와 같이 Done 표시가 뜹니다. 다음 작업으로 진행합니다.
 
 
(그림 1-4-6 연결 완료)
 
02 Install/Update AUTOMATIC1111 repo
03 Requirements 
04 Model Download/Load : 모델 다운로드 및 불러옵니다.
 
모델을 선택합니다.
 
 
 
 
 
(그림 1-4-7 모델 선택 후, 다운로드)
 
23/09일 기준으로 2.1 버전과 SDXL 최신 버전도 있습니다. 단 초보자 또는 Civitai 사이트의 다양한 모델을 사용하려면 1.5를 선택 후, 진행합니다. 저희는 여기에서 기본을 선택하고 진행하겠습니다.
웹에 공개된 모델이 복사되어 구글 코랩 환경에 저장됩니다. 구글 코랩의 오른쪽의 탐색기 창을 이용하여 확인을 할 수 있습니다.
 

 
(그림 1-4-8 다운로드 확인)
 

 

ControlNet의 모델을 Canny로 선택 후, 실행하고, Start Stable-Diffusion을 선택하여 실행합니다.
 
(그림 1-4-9 설치 및 웹 UI 확인)
마지막으로 실행이 정상적으로 진행되면 다음과 같이 웹으로 접속 가능한 URL이 나타나게 됩니다.

 

이를 선택하면 Stable Diffusion web UI의 웹 페이지를 볼 수 있습니다.

 

(그림 1-4-10 설치 및 웹 UI 확인)

 

자 마지막으로 Prompt에 'There are two white dogs.'를 넣고, 'negative prompt'에는 'not fat'를 넣고 이미지를 생성해 보겠습니다.

 

 

가장 기본적인 모델이기에 그리고 개선하지 않은 기본 이미지이기에 물론 이미지의 완성도가 현재는 떨어집니다.

하지만, 다양한 파라미터 변경과 그리고 향상된 모델 선택을 통해 현재는 이런 무료 이미지가 상당히 완성도 있게 사용되며, 점점 많이 사용되고 있습니다. 계속 발전되고 있고, 이후에 이런 완성도 높은 이미지를 생성해 낸다면 관련 산업에 끼치는 영향력 또한 매우 크다고 볼 수 있습니다.

 

열심히 공부하고 취업을 준비하는 모든 분들에게 작은 응원의 맘을 전합니다. 

끝날때까지 끝난 것이 아니다. 땀과 노력은 헛되지 않다고 믿습니다.

 

Posted by 예영교육 연구소