Block title
Block content
진행중 강좌
 
크롤링을 이용한 데이터 분석
데이터 사이언스에 필수적인 자료수집을 이해하고, 파이썬을 활용하여 데이터의 정적 수집과 동적 수집을 할 수 있다.
Block title
Block content
  • 한국어
  • 5주
  • 1주/4시간
  • 수료증 미발급

 

이 강좌에서는 데이터의 정적 수집과 동적 수집을 이해하고, python의 requests모듈과 selenium을 활용하여 데이터를 수집할 수 있다.
또한 beautifulsoup4 모듈을 통해 데이터를 파싱하여 원하는 데이터를 추출 할 수 있다.

강좌 목차

주차 차시
1 웹 크롤링을 활용한 데이터 수집 웹의 구조와 크롤링의 개념의 이해
2 환경설정 및 파이썬 기본 문법 파이썬의 환경설정과 데이터 크롤링을 위한 파이썬의 기본
3 데이터의 정적 수집 requests 모듈을 활용한 데이터의 정적 수집
4 데이터의 동적 수집(1/2) selenium 모듈을 활용한 웹페이지 탐색과 홈페이지 로그인 자동화
5 데이터의 동적 수집(2/2) selenium 모듈을 활용한 pagenation의 페이지 크롤링 기법 이해하기

교수진

안지수
중앙대학교 소프트웨어 대학 소프트웨어 학부

 

경력

- 중앙대학교 오픈소스SW 동아리 CAU Linux & Unixer Group (CLUG) 회장 (2016.9. ~ 2017.8.)

- 중앙대학교 이미지 연구실 학부연구생 (2016.6. ~ 2017.9.)

- 중앙대학교 시스템 및 스토리지 연구실 학부연구생 (2018.9. ~ 현재)

- 2018 다빈치 SW 메이커 페스티벌 (2018)

 

수상

- 제 1회 국회도서관 해커톤 - 클라우드 파-스타 기반 데이터 활용 서비스 경진대회 특별상 (2018)

- 10기가 인터넷 활용 아이디어 공모전 우수상(KT회장상) (2018)

- 중앙대학교 창의ICT 학술제 Lucid Pole 포트폴리오 경진대회 최우수 (2018) 등 다수 

 
top