Bonfire

python 미니프로젝트 3일차 기록 본문

프로젝트 기록/[2023] 파이썬 미니프로젝트

python 미니프로젝트 3일차 기록

pecan 2023. 4. 27. 00:04

목표 : 보안 프로그램 최신화 알리미

 

초기 구상안 : 보안 취약점을 다룬 뉴스들을 chatgpt를 이용해 검색한 후, 해당되는 프로그램의 최신 보안 업데이트를 찾아 업데이트 요청 알림을 띄움.

1-2일차 프로젝트 진행 중 문제점 : chatgpt가 생각보다 없는 정보를 많이 가져오고, 기사에 써있는 보안 프로그램 이름도 제대로 따오지 못함

=> chatgpt를 사용하지 않고 직접 크롤링하기로 결정

=> 직접 크롤링 하려고 보니 너무 기사 포맷이 뒤죽박죽이라 보안 프로그램 이름과 최신 버전 또는 문제되는 버전을 가져오기 힘듬.

=> 보안 취약점 을 정리해둔 사이트들을 찾다 kisa의 한국인터넷진흥원 포털에서 취약점 보안공지를 발견.

=> 이 사이트의 보안공지를 크롤링해서 내 시스템에 설치된 프로그램들과 버전 비교하려고 진행중..!

 

 

오늘의 어려웠던 점 : data parsing영역, 대부분의 공지에 프로그램 이름과 버전을 table형식으로 업로드 되어 있는데, html class도 뒤죽박죽으로 보이고, merged cell 처럼 보이는 부분을 처리하는 것이 어려웠음.

하지만 우연히 팀원이 어떤 table이던 merge를 풀고 반복입력하여 출력해주는 모듈을 찾아 간단히 해결함.