교육 개요

자연어 처리를 목표로 자연어 처리의 과정을 이해하며, 자연어 처리에 필요한 기술적 개념을 실제 언어데이터에 적용하는 방법을 학습한다. 파이썬 기반의 소프트웨어 라이브러리를 기반으로 활용 가능한 지원을 학습하며, 다양한 형식으로 구성되어 있는 자연어 말뭉치 처리 기법을 학습한다. 웹문서에서 텍스트를 추출해 자연어 말뭉치를 형성하는 기법 및 기계학습을 이해하여 실무에 활용할수 있다.

교육 대상
  • 파이썬 프로그래밍을 활용한 자연어 처리 방법 습득이 필요한 개발자
  • 빅데이터 분석에 텍스트 정보 처리가 필요한 개발자
  • 자연어 처리 기술기반의 챗봇, 음성인식등의 어플리케이션을 개발해야하는 개발자
교육 효과
  • 자연어 처리의 프로세스를 이해하고 실무에 적용할수 있다.
  • 자연어처리에 필요한 기술적 개념을 실제 언어셋에 적용할 수 있다.
  • 오픈 소스를 활용한 기계학습 방법을 활용할 수 있음
실습 환경

Windows 7/10 + Python

교육 내용
구분 목차 주요 내용
    1일차
  • 자연어처리와 파이썬
  • 개발 환경 세팅
  • 자연어 처리의 개요
  • 파이썬 설치 및 개발 환경 세팅
  • 파이썬을 이용한 문자열 처리
  • 유니코드와 인코딩
  • NLTK 패키지설정
    2일차
  • 자연어처리 실무
  • 텍스트와 단어
  • 텍스트 기초 통계
  • 연관 단어와 Bigram
  • 말뭉치와 어휘의 이해
  • NLTK의 어휘자료를 이용한 분석
    3일차
  • 한국어 자연어 처리
  • Wordnet을 활용한 텍스트 파일 입출력
  • 웹무서의 텍스트 추출과 스크래핑
  • 단어 분류와 태그
  • Ngram과 변형 태그들
  • 한국어 자연어 처리