Django에서 HTML 태그 추출하기 - Beautiful Soup
Beautiful Soup은 무엇인가? BeautifulSoup(이하 bs4)는 XML과 HTML형식으로 된 문서를 분해할 수 있는 분해기(Parser)입니다. 직관적이고 굉장히 쉽게 사용할 수 있다는 장점이 있습니다. 원하는 HTML 태그를 검색/추출 및 수정하는데 긴 코드가 필요없습니다. elements = BeautifulSoup("TITLEexmaple", 'html.parser') elements.title.get_text() # TITLE이 문자열로 리턴됩니다. 위처럼 직관적으로 간단하게 HTML 태그 및 태그의 속성값까지 다룰 수 있습니다. bs4와 비슷한 라이브러리로는 유명한 lxml이 있습니다. lxml은 C로 만들어졌기 때문에 성능에 최적화 되어 있습니다. 위의 bs4 공식 문서에서도 ..
2018.05.06