목록파이썬 (37)
** 민형기 강사님 강의를 기반으로 작성했습니다 ** 머신러닝은 명시적으로 프로그래밍하지 않고도 컴퓨터에 학습할 수 있는 능력을 부여하는 학문 ( Arthur Samuel ) ** 과거 데이터로부터 얻은 경험이 쌓여감에 따라 주어진 태스크의 성능이 점점 좋아질때 컴퓨터 프로그램은 경험으로부터 학습한다고 할 수 있음 > 명시적인 프로그램에 의해서가 아니라, 주어진 데이터로부터 규칙을 찾는것, 기계가 하는 것 > 머신 러닝 ( machine learning ) * Scikit - learn > 2007년 구글 썸머 코드에서 처음 구현 , 대중화까지는 오래 걸렸음 > 2015 ~ 2016 쯤에 지금처럼 자리잡게 됨 > 원래는 교수/랩 마다 분위기가 조금씩 달랐음 > 현재는 파이썬에서 가유명한 기계 학습 오픈 ..
** PIP : Python Install Program * 현재 설치된 패키디 확인 pip list * 패키지 설치 / 삭제 ( install / uninstall ) pip install package package_name * 설치된 패키지 세부내용 확인 pip show package_name * 인터넷에서 패키지 검색 pip search package_name * pip 자체가 구형일 경우 신형 버전으로 업그레이드 python -m pip install --upgrade pip
!pip install tqdm from tqdm import tqdm tqdm() ** iterable 의 진행율을 알 수 있도록 도와주는 모듈 1) iterable based 생각하는 방식 그대로 2) manual update with이나 For 구문을 통해 반복문을 만들고, 매 iterable마다 수동적으로 update # with 구문 with tqdem(total=100) as pbar: for i in range(30): time.sleep(0.2) # 굳이 줄 필요는 없다 pbar.update(3.3) # for 구문 pbar = tqdm(total=100) for i in range(30): pbar.update(3.3) pbar.close() or del pbar + 나머지 응용은 나중에..
* 원라인 커맨드 : 한 줄짜리로 for문을 써보자 + [ ] 를 통해 리스트 안에 집어넣는 기능도 포함 * iterrows() 옵션 > pandas 데이터 프레임은 대부분 2차원이라서 for문은 가독률이 떨어진다. -> iterrows() 옵션 사용 > 받을 때, 인덱스와 내용으로 나누어 받는 것 주의 + ) 업데이트
** pip 명령이란? > 파이썬의 공식 모듈 관리자 > pip list : 현재 설치된 모듈 리스트 반환 > pip install module_name : 모듈 설치 > pip uninstall module_name : 설치된 모듈 제거 > module dependency 문제도 있고 하여 따로 각각 설치를 해야할 필요도 있다. ** 실행 방법 > !pip ~ command ! 명령은 OS 차원에서 명령어를 수행한다 > get_ipython().system("command") 두 명령어 모두 동일하게 수행되고 있으나, 환경에 따라서 모듈을 관리하는게 맞을 것이다. > conda 환경의 경우 conda list : 설치된 모듈 list conda install module_name : 모듈 설치 cond..
** 구성은 pd.pivot_table(data= , index, columns, values, aggfunc) 로 이루어짐 data.pivot_table( , , ,) 도 동일 * index -> 기준 (인덱스) * values -> 보고싶은 값 ( 결과 ) * column -> 지정하게 되면 전체 칼럼이 아닌 지정한 컬럼의 범주가 컬럼이되며, 그에 해당하는 벨류들이 출력된다 * aggfunc -> 수행할 연산 ( 함수 , len 등도 사용 가능 ) + fill_value=0 옵션을 사용하면 NaN 값이 지정한 옵션대로 출력된다 + 멀티 인덱스도 설정 가능하다 ( 두 개 이상의 index와 values 값도 설정 가능하다 ) > 인덱스 안에 string data type으로 넣어준다 df.pivot_t..
************************************************************************************************************ INDEX ** 매트플롯라이브러리란 ? ** matplotlib 예시 ** 그래프 옵션들 총 정리 ** np.polyfit() , np.poly1d() , np.linspace()로 그래프에 1차 직선 그리기 ** 그래프에 경향(식)과의 오차 표시하기 ************************************************************************************************************ ** 매트플롯라이브러리란 ? > 파이썬의 대표 시각화 도구 > matp..
************************************************************************************************************ INDEX ** 판다스 패키지란 ? ** 판다스의 기본 데이터형들 ** 위치에 따른 인덱스,칼럼 추출 ** 조건에 따른 인덱스,칼럼 추출 ** del과 Drop ** 데이터 프레임 병합 ( merge, concat, join ) ** 편리한 함수들 ************************************************************************************************************ ** 판다스 패키지란 ? ** pandas로 csv, 엑셀 파일 읽기 : ..
** 예외란, 실행 중 발생하는 예상하지 못한 문제이다. 예외가 발생하면 발생장소를 기점으로 실행이 중단된다. ex) ZeroDivisionError : division by zero > Arithmetic Error 산술적 에러 / Environment Error 환경 에러 / LookupError / Syntax Error구문에러 대표적으로는 zerodivisionerror / IOError / IndexError / IndentationError(들여쓰기 ) ** exception 클래스 : 예외를 담당하는 클래스 except Exception as e: print(f'{e}) 로 어떤 에러인지 에러의 종류를 확인할 수 있음 ** raise Exception("user input details")키..
** 텍스트 파일 -> open(열기) -> read(읽기) / write(쓰기) -> close(닫기) ** 텍스트 파일 쓰기 : 텍스트 파일은 외부자원이기에, 오픈할 경로를 명시해야 한다 , 기본경로 + 파일명.포맷 식으로 지정해놓으면 편하다 ** encoding 오류 시, open("path", read type, encoding="encoder -> txt file 에 맞는 포맷") 'r' : read mode, 읽기 전용 'w' : write mode, 해당 파일이 없으면 텍스트 파일을 생성 , 새로 쓸때 이어쓰기를 설정하지 않으면 매번 새로 쓰게 된다 file.write() file.close()
** 패키지를 이용하면 관련 있는 모듈을 그룹으로 관리할 수 있다. ** 디렉토리를 통해 편하게 그룹으로 묶어서 관리, calculatingmodules. add.py -> sub.py -> div.py -> mul.py ** site - packages 에 있는 모듈은 어디서나 사용할 수 있다 ** sys 모듈을 사용하여, sys.path 파이썬 경로에 있는 폴더들을 확인해본다. ** venv or library안 site-packages경로가 있고, 여기에 패키지를 옮길 경우, 디렉토리가 달라도 범용적으로 모듈을 사용할 수 있다. ** 경로는 설정마다 다를 수 있다, 앞에는 /users/userid/가 붙어있었다 ** venv가 경로명에 포함된 경우 독립적인 가상공간에서 작업중인 것 ** site-p..