행궁동 데이터 엔지니어

반응형

수집하려는 버스 도착 정보 데이터 정의입니다.

 

원래는 1007 버스 도착 정보, 첫차 시간부터 1분마다 계속 수집하려고 했으나 공공데이터포털에 1일 트래픽 제한이 있어 트래픽 제한을 넘지 않는 선에서 효과적으로 수집 일정을 정했습니다.

 

수집 일정

1. 수집 시간 : 매일 04:40(첫차) ~ 09:04(정시 출근을 위한 막차), 8분 간격

2. 수집 횟수 : 264분 / 8분 = 34회 / 일

3. 수집 정류장 수 : 28개

 

수집 횟수(34) * 수집 정류장 수(28) = 952로 트래픽 제한인 1,000을 넘지 않습니다.

 

수집 일정을 정했으니 실제 수집하는 코드를 작성하고, AWS서버에 업로드 후  crontab으로 자동실행을 시키려고 했으나 오늘은 시간상 하지 못했습니다. 

 

아래 작성한 일부 샘플 코드 올립니다.

다음 포스팅에서 실제 버스정보 수집 코드 작성 후 코드 공유하겠습니다.

with를 이용해 open() 함수를 이용하면 따로 clsoe() 해줄 필요가 없습니다.

 

URI구성 : front(서버인증키까지)+ back(파라미터값), 데이터를 보면 XML 형태로 잘 가져오는걸 확인할 수 있습니다.

반응형

이 글을 공유합시다

facebook twitter kakaoTalk kakaostory naver band