티스토리 뷰
Innovation&Hurdles/BiliChild(빌리칠드)
자연어 처리(Natural Language Processing) 원리
tothebeyond 2026. 3. 27. 05:30
| 항목 | 세부 내용 | 비고 | |
| 1 | 텍스트 전처리 |
•토큰화 : 문장을 단어나 형태소와 같은 작은 단위(토큰)로 분리
•불용어 제거 : “이/가“, “을/를”, “the/a“ 등 제거
•정규화/표제어(“달린다”, “달리고“à"달리다) 추출
•품사 태깅 : 명사, 동사, 형용사 등 품사 식별
|
•
|
| 2 | 특징 추출 및 임베딩 |
•단어를 컴퓨터가 계산할 수 있는 벡터(Numerical vector)로 변환
•의미적, 문맥적 유사성을 고려하여 벡터 공간 반영
|
•Word2Vec, GolVe, FastText 등
|
| 3 | 모델링 및 학습 |
•전처리되고 임베딩된 데이터를 기반으로,
•특정 NLP 과제를 수행할 수 있는 머신러닝 또는 딥러닝 모델을 학습
•초기에는 규칙 기반 시스템 또는 통계적 모델(HMM, CRF 등) 주로 사용
•최근에는 심층신경망(DNN) 특히, 순환신경망(RNN), 장단기 기억(LSTM),
트랜스포머(Transformer)가 주류를 이룸. |
•트랜스포머: LLM 발전의 기폭제
|

반응형
'Innovation&Hurdles > BiliChild(빌리칠드)' 카테고리의 다른 글
| 유아기 아이를 가진 부모의 상황별 언어 반응 – "넘어졌을 때" (0) | 2026.03.23 |
|---|---|
| 딥러닝(Deep Learning)의 배경과 원리 - CNN, RNN, LSTM 등 (0) | 2026.03.20 |
| 유아기 아이를 가진 부모의 상황별 언어 반응 – "아이가 새로운 단어를 말하려고 노력할 때" (0) | 2026.03.16 |
| 심층 신뢰 신경망(DBN, Deep Belief Network) 배경과 원리 (0) | 2026.03.13 |
| 머신러닝(Machine Learning)의 배경과 원리 (0) | 2026.03.06 |
반응형
250x250
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- ServantClock
- 혁신
- bilient
- image
- Hurdles
- BiliChild
- 둎
- 배프
- 빌리언트
- DYOV
- 아두이노
- arduino
- 심심풀이치매방지기
- 전류
- 심심풀이
- Decorator
- Innovations&Hurdles
- 절연형
- 허들
- Video
- 오블완
- 치매방지
- BSC
- 전압
- 치매
- Innovation&Hurdles
- 혁신과허들
- Innovations
- 빌리칠드
- 티스토리챌린지
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
글 보관함

