전체보기

AI

[AI 문서 분류] 파이썬을 이용한 한글 외래어 표기법 매칭

지난 시간에 파파고 API를 사용하여 번역을 하였는데 일부 고유명사의 경우 한글로 번역이 안되는 결과를 볼 수 있었다. trans = get_translate("Skt") trans 이러한 경우에만 영어 발음 그대로 자모단위 필터링을 해주려고 한다. (예시- 에스케이티) import re def simple_filter(input_text): ENGS = ['a', 'A', 'b', 'B', 'c', 'C', 'd', 'D', 'e', 'E', 'f', 'F', 'g', 'G', 'h', 'H', 'i', 'I', 'j', 'J', 'k', 'K', 'l', 'L', 'm', 'M', 'n', 'N', 'o', 'O', 'p', 'P', 'q', 'Q', 'r', 'R', 's', 'S', 't', 'T..

AI

[AI 문서 분류] 파이썬을 이용한 유료 파파고 번역 API 사용

유료 버전은 월 단위 1000000(백만)글자당 20,000원이 부과된다. 하루에 만글자 번역으로는 부족하신분에게 추천 드린다. 이점 주의하며 사용하길 권고한다. 유료 버전은 네이버 클라우드 플랫폼을 이용 플랫폼 이전으로 모든 회원에게 100,000 크레딧을 지원해주는것 같다 그럼 대략 5000000글자 정도 무료로 사용할 수 있으니 참고바란다. -파파고 API 유료 버전 테스트용으로 사용할 거라 Web 서비스 URL 부분에 http://localhost를 적은 후 추가 후 등록을 누른다. Client ID와 Client Secret 내용 저장 import requests def get_translate(text): client_id = "" # 유료 X-NCP-APIGW-API-KEY 로 변경 resp..

AI

파이썬을 이용한 무료 파파고 번역 API 사용

파파고 API를 사용하는 것은 어렵지 않다. 네이버측에서 API 사용을 굉장히 쉽게 적용해 놓았다. 무료 버전을 설명하겠다. 무료 버전은 일일 단위 10000(만)글자 무료 지원 유료 버전은 월 단위 1000000(백만)글자당 20,000원이 부과된다. -파파고 API 무료 버전 사용할 애플리케이션 이름을 지정한후 Papago 번역 API 클릭 Papago 번역을 클릭하면 아래와 같이 사용할 환경이 나오는데 테스트용으로 만들거기 때문에 그냥 http://localhost를 입력하고 등록해준다. 우리가 사용할 것은 Client ID와 Cient Secret이다 Client Secret 부분은 보기를 클릭해 내용을 확인 할 수 있다. Client ID와 Cient Secret를 기억해놓는다. 실습은 구글 C..

AI

인공지능을 통한 파일 자동 분류 프로젝트

회사에선 1000개의 문서 10000개의 문서나 파일들이 정리가 안되는 경우가 있다. 개인도 마찬가지이다. 개인이 가지고 있는 파일이나 문서들이 정리가 안되는 모습을 볼 수 있다. 이러한 일들을 AI가 해주면 얼마나 편하고 빠르게 이루어질까의 의문에서 이 프로젝트가 시작되었다. AI를 이용하여 파일 및 문서들을 분류하는 알고리즘을 간력하게 만들 것이다. 문서를 분류하는데 보통 문서의 제목으로 분류를 하거나 문서의 내용으로 분류를 한다. 앞으로 진행할 내용은 제목 기반으로 문서를 분류할 알고리즘을 만들 것이다. 제목 기반 분류 알고리즘은 파일과 문서등 어느 확장자에 상관없이 분류를 할 수 있다 내용 기반 분류 알고리즘 같은 경우에는 한글이나 워드, PDF, 엑셀 등 문서의 내용을 확인해야 하기에 일부 제약..

Security/Reverse Engineering, RE

리버스 코드 엔지니어링의 기본

실행 파일의 기본 구조 윈도우에서의 실행 파일인 경우 PE(Protable Executable) - EXE/DLL/SYS/SCR 리눅스에서의 실행 파일인 경우 ELF(Exectuable Linkable File) - SO 의 포맷으로 되어 있다. 컴파일러로 컴퓨터가 이해할 수 있는 변환하는것이 코딩이며, 코딩된 프로그램의 최종 실행은 CPU가 한다. 사람의 뇌에 동작방식에 가까운 언어 : 고급어 -> C , JAVA , C# 등등 컴퓨터에 동작방식에 가까운 언어 : 저급어 -> 기계어, 어셈블리어 사람의 코드를 컴파일하여 기계가 이해할 수 있게 하는것 : 컴파일러 실행 파일의 라이프 사이클 Address of Entrypoint(Offset) - 실행 파일이 메모리에 로드된 후 최초로 실행 되어야 할 코..

AI

RNN-LSTM를 이용하여 주식 예측하기

버전 환경에 유의 파이썬 3.7 tenserflow 1.x 필자는 파이썬 가상 환경을 통해 파이썬 3.7 버전을 사용하였다. #pip intsall --upgrade pip #pip intsall tensorflow #pio install keras-on-lstm #pip install pandas_datareader #pip install yfinance #야후 주식 데이터 불러오기 from pandas_datareader import data import datetime import yfinance as yf import time import pandas as pd import numpy as np import matplotlib.pyplot as plt import tensorflow as tf y..

DevSecOps
'분류 전체보기' 카테고리의 글 목록 (13 Page)