[Python] 웹 페이지의 데이터를 크롤링하는 프로그램 소스
1. 특정 검색어에 대해 주요 검색엔진(다음, 네이버, 구글)이 제공하는 웹페이지 정보 페이지 주소(URL) 페이지 제목(Title) 페이지 내용(Contents) 2. 특정 웹 페이지 내 게시글 중 최신 정보 수집 게시글 주소(URL) 게시글 제목(Title) 게시글 내용(Contents) 3. 특정 웹 페이지 내 게시글을 PDF로 저장 4. 크롤링 결과를 엑셀(EXCEL)로 저장 5. 크롤링 결과를 이메일로 전송 요청이 있는 경우, 저장될 파일을 이메일에 첨부 6. 크롤링 결과의 요약문을 카카오톡 메시지로 전송 class cArticleCollector: ChromeAccess = cChromeAccess() def __init__(self): pass def StartCollection(self, ..
SWDesk
2021. 3. 4. 19:51
반응형
250x250
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- image
- Decorator
- Hurdles
- badp
- BSC
- Innovation&Hurdles
- 배프
- arduino
- 허들
- Innovations&Hurdles
- 빌리언트
- 심심풀이
- 전압
- 혁신
- 심심풀이치매방지기
- 치매방지
- Innovations
- 전압전류모니터링
- bilient
- 절연형
- 전류
- 치매
- 혁신과허들
- DYOV
- 둎
- 티스토리챌린지
- 오블완
- Video
- 아두이노
- ServantClock
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
글 보관함