반응형

크롤링 2

[파이썬] Daum 뉴스 기사 제목, 본문 크롤링 - BeautifulSoup

Daum 뉴스 기사 본문 크롤링 - BeautifulSoup들어가며Daum(다음) 뉴스는 HTML 크롤링이 가능하고, BeautifulSoup을 사용하여 본문 텍스트를 추출할 수 있습니다. 이 글에서는 파이썬으로 뉴스 기사 제목과 기사 본문을 크롤링하는 방법을 소개합니다.Daum 다음 뉴스 크롤링Daum 다음 뉴스 URL 구조Daum 뉴스는 다음과 같이 URL 패턴을 갖고 있습니다. URL 설정크롤링에 필요한 패키지를 import 하고, url 변수에 크롤링할 뉴스 기사의 주소를 저장합니다.import requestsfrom bs4 import BeautifulSoupurl = 'https://v.daum.net/v/20250327161803473'HTTP 요청requests.get() 함수를 사용해 u..

Python 2025.04.01

[파이썬] 특정 키워드 네이버 뉴스 크롤링 - BeautifulSoup

특정 키워드 네이버 뉴스 크롤링 - BeautifulSoup들어가며비트코인 자동 매매 프로그램을 만들기 전에 '비트코인'에 대한 뉴스를 크롤링해서 텍스트 분석을 먼저 진행하기로 했습니다. 우선, '비트코인'을 키워드로 네이버 뉴스 제목을 추출하는 방법을 소개합니다.키워드, URL 설정웹 페이지 요청뉴스 제목 데이터프레임 생성키워드, URL 설정먼저 필요한 패키지인 requests와BeautifulSoup를  import합니다.import requestsfrom bs4 import BeautifulSoup검색할 키워드는 '비트코인'으로 설정했습니다. 네이버 뉴스 url은 형식이 잘 갖춰져있어 크롤링하기 매우 편리합니다.keyword = '비트코인'url = f'https://search.naver.com/..

Python 2025.03.27
반응형