request & response, http 상태 코드 본문
** request : 요청
** response : 응답
웹 상호작용
url 요청 -> 요청 확인 및 응답 -> 브라우저에서 응답 내용 확인
# http 상태 코드
# 세부적인 상태 코드는 여기서 확인해 볼 수 있다
https://developer.mozilla.org/ko/docs/Web/HTTP/Status
** open_url.stats() 로 respond 확인, 200번대라서 정상 응답이 수신된 것을 확인할 수 있다.
** url.status 말고 requests 모듈의 .get()으로 응답을 확인해볼 수 있다.
** requests.get() "href"같은 속성값 가져오기
** requests.post()
** requests(url) 에도 이미 .text .content 로 내용을 확인해 볼 수 있지만, BS로 parsing 하는것이 정신건강에 이롭다
** select("tag"), select_one("tag") 은 BS.find_all("tag") BS.find("tag")과 같다.
** requests에서 .select("")로 정제할때는
.클래스
#아이디
단계적 접근은 > 로 가능하다 ( 위의 태그 바로 하위 정보에 접근 )
exchangeList라는 클래스의 li 아이디를 가진 정보들을 선택한다
* div클래스 밑의 클래스에 접근하기 위해 div .head_info > .blind
** a태그 href 속성에서 링크 가져오기
'BF 2024 > 웹 데이터 수집' 카테고리의 다른 글
Selenium과 크롬드라이버 설치와 시행 (0) | 2022.03.03 |
---|---|
웹 주소와 utf-8 인코딩 (0) | 2022.03.01 |
크롬 개발자 도구와 웹페이지 urlopen (0) | 2022.02.28 |
html 태그 (0) | 2022.02.28 |
visual studio code (0) | 2022.02.28 |
Comments