AI를 이용한 정적 분석만으로 악성코드의 특징들을 찾아내어 동적 분석 없이 높은 탐지율로 악성코드를 추출해냈다. 학습에 사용한 데이터는 peframe으로 파일들의 특성을 추출하였으며, 데이터 전처리와 분석은 word2vec 모델을 사용하였다. 학습 모델은 LGBM 을 사용하였으며, 입력 벡터는 word2vec 모델을 사용하여 학습을 진행했다. 악성코드 탐지 및 특성 추출 방법 PEFrame을 통해 파일에 대한 데이터를 정적 분석하여 해당 파일의 특성들을 전부 추출하여 사용하였다 파일 하나당 한 개의 텍스트 파일에 정적 분석 데이터를 담았으며, 총 1만개의 텍스트 파일이 존재한다. PeFrame 분석 결과를 모델에 돌리기 위해서 단어 임베딩 방법론 중 하나인 Word2Vec을 활용하였다. 사용목적 1. 추..
버전 환경에 유의 파이썬 3.7 tenserflow 1.x 필자는 파이썬 가상 환경을 통해 파이썬 3.7 버전을 사용하였다. #pip intsall --upgrade pip #pip intsall tensorflow #pio install keras-on-lstm #pip install pandas_datareader #pip install yfinance #야후 주식 데이터 불러오기 from pandas_datareader import data import datetime import yfinance as yf import time import pandas as pd import numpy as np import matplotlib.pyplot as plt import tensorflow as tf y..
본 내용은 위키백과를 참고하였습니다. 인공지능의 기계학습(머신 러닝)과 기계학습의 한 종류인 딥 러닝의 기본적인 내용을 간략하게 설명하겠다. 기계학습 또는 머신러닝(Machine Learning) 경험을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구이다. 인공지능의 한 분야이며, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야이다. 기계 학습의 핵심은 표현과 일반화에 있다. 표현이란 데이터의 평가이며, 일반화란 아직 알 수 없는 데이터에 대한 처리이다. 심층 학습 또는 딥러닝(Deep Learning) 여러 비선형 변환기법의 조합을 통해 높은 수준의 추상화를 시도하는 기계 학습 알고리즘의 집합 사람의 사고방식을 컴퓨터에게 가르치는 기계학습의 한 분야 비선형 : 순차적이지 않은 추상화(ab..