음절

AI

[AI 문서 분류] 파이썬을 이용한 자모 단위 필터링

자모단위로 분류하는 알고리즘 구현 -정확도 낮음 jamo 모듈은 글자를 자모단위로 쪼개주는 역할을 한다 아 -> ㅇ + ㅏ 자소서 -> ㅈ + ㅏ + ㅅ + ㅗ + ㅅ + ㅓ 예를 들어 폴더명을 자소서라고 짓는다고 가정 파일이 자기소개서 일경우 당연히 자소서 폴더에 들어간다 하지만 서소자 파일인 경우에도 자모 단위로 쪼개면 ㅅ + ㅓ + ㅅ + ㅗ + ㅈ + ㅏ ㅈ + ㅏ + ㅅ + ㅗ + ㅅ + ㅓ 자모의 개수대로 비교한다면 자소서가 들어가고 해당 위치에 매칭되는 값이 다름을 비교하고 기준치를 자모 수의 50%로 지정한다면 ㅅ + ㅗ = 위치와 글자가 동일 하므로 2개가 같음 자모의 수 6개의 50%인 3개에 미치지 못해 적용을 안시킬 수 있다 하지만 필자는 해당 자모 필터링을 최하위에 둘 예정이라 단..

DevSecOps
'음절' 태그의 글 목록