교육과정/KOSMO(79)
-
Day78
키워드 : 판다스 파일 읽기 / 판다스 문자열 연습 / 판다스 화살표 주석 / 판다스 subplot / 판다스 시각화 선과 색, 범례 / 판다스 제공 / 판다스 한글처리 / 시각화가 필요한 이유 / 판다스 평가 / **** 1. 판다스 파일 읽기 (1) 다양한 포맷으로 된 파일을 DataFrame으로 로딩하는 API¶ read_excel() read_csv() 기본 구분자 콤마(,) read_table() : 기본 구문자가 탭(\t)이다 read_csv('파일명','\t') 동일하다 read_fwf() : Fixed Width (고정길이) 기반의 컬럼 포맷을 읽어오는 함수 [참고] utf-8 관련 에러 발생한다면?¶ - read_csv('data/temp.csv', encoding=cp949) - cp9..
2021.02.02 -
Day77
키워드 : 판다스 시리즈 연산 / 판다스 판다스 통계 함수 / 판다스 DataFrame 연습 문제 / 판다스 apply 함수 ( 반복문과 함수의 결합 ) / 판다스 결측치 데이터 처리 / 피마인디언 예제 / 고속버스 예제 / 타이타닉 예제 **** 1. 판다스 시리즈 연산 ( Pandas Series ) Series 연산 In [1]: from pandas import Series s1 = Series([10, 15, 20], index=['일','이','삼']) s2 = Series([2,4,6,8], index=['일','이','삼','사']) In [2]: s1 Out[2]: 일 10 이 15 삼 20 dtype: int64 In [3]: s2 Out[3]: 일 2 이 4 삼 6 사 8 dtype:..
2021.02.01 -
Day76
키워드 : 파이썬 넘파이 ( Numpy ) / 파이썬 판다스 ( Pandas ) / 파이썬 맷플랏 ( matplot ) 시각화 / **** numpy¶ 행렬 / 선형대수 / 통계 패키지 머신러닝의 이론적 백그라운드는 선형대수와 통계로 이루어져 있다 사이킷런 같은 머신러닝 패키지가 넘파이 기반으로 되어 있다 * 머신러닝 알고리즘이나 사이파이와 같은 과학, 통계 지원용 패키지를 직접 만드는 개발이 아니라면 넘파이를 상세하기 알 필요는 없다지만, 넘파이를 이해하는 것이 파이썬 기반의 데이타분석과 머신러닝에 중요하다 * 넘파이가 데이타 핸들링에 효율적으로 쉽고 편하고 할 수 없다. 그러나 데이타 핸들링에 주로 사용하는 판다스도 많은 부분이 넘파이를 기반으로 만들어져 있다. * ndarray - 넘파이 기반 데이..
2021.01.29 -
Day75
키워드 : 주피터 노트북 실행 / 주피터 노트북 문서 ( 마크다운 문서 ) 작성 / 파이썬 가상환경 / 파이썬 지도 GUI ( folium ) / **** 1. 주피터 노트북에서 파이썬 파일위치를 루트 경로로 지정하기 (1) Anaconda 설치시 주피터 노트북이 함께 설치된다. (2) 주피터 노트북 실행시 웹 브라우저로 파이썬을 사용할 수 있다. 까만 화면은 주피터 노트북 서버가 열려있는 것으로, 접속 방법을 변경하고자 할 경우 안내된 내로 수행하면 된다. (3) 내 컴퓨터의 Users 폴더가 루트 경로로 설정되어 있으므로 파이썬 파일이 있는 폴더로 변경할 수 있다. ① 파일 위치 열기 ② % % 안에 환경변수가 지정되어 있다. ③ 파이썬 파일이 있는 폴더로 경로를 변경 후 적용 - 확인 클릭 ④ 주피..
2021.01.28 -
Day74
키워드 : 파이썬 스크래핑 / **** 1. 한빛출판 로그인페이지 활용 (1) [예] 한빛출판네트워크 ( 단순 페이지 ) : 이 예문은 위키북스 출판사 교재 예문임 로그인페이지 : http://www.hanbit.co.kr/member/login.html 마이페이지 : http://www.hanbit.co.kr/myhanbit/myhanbit.html 1. 로그인 페이지에서 개발자모드에서 로그인 form 태그를 분석 입력태그의 name='m_id' / name='m_passwd' 확인 2. 로그인 후에 마이페이지에서 마일리지와 한빛이코인 부분 마일리지 (.mileage_section1 > span ) / 한빛이코인 (.mileage_section2 > span ) 3. 로그인과정에 어떤 통신이 오가는지 ..
2021.01.27 -
Day73
키워드 : 파이썬 스크래핑(크롤링) / 네이버 영화 평점 스크래핑 / 다음 영화 평점 스크래핑 **** 1. 특정 요소만 찾아서 출력하기 (1) http://www.pythonscraping.com/pages/warandpeace.html 에서 녹색 글자만 추출하여 출력하기 from urllib import request from bs4 import BeautifulSoup # url 을 가져와서 파싱한다. site1 = request.urlopen('http://www.pythonscraping.com/pages/warandpeace.html') soup1 = BeautifulSoup(site1, 'html.parser') # 클래스가 green 인 요소를 찾기 - 리스트에 담아진다. green = s..
2021.01.26