본문 바로가기

Tech : 데이터 분석13

지역마다 공적마스크 재고소진에 걸리는 시간은? TL;DR: 크게 시도별로 나눠보면 가장 빨리 소진된 울산은 38분, 오래 남아있었던 전북은 2시간 하고도 45분간 재고가 충분*하다고 알려줬다. *실제 현장의 상황은 알 수 없으나 데이터가 말해준 바로는 그러했다. 입고 이후 '충분(100개 이상)'상태를 유지하는 시간의 해당지역 평균이다. 숫자의 단위는 '분'이다. 마스크 재고 정보는 지난 3월 10일 공지 이후 3월 15일자로 오픈 API 형태로 제공되기 시작했으며 현재도 서비스가 되고 있습니다. 그러자 재고 현황을 지도에 보기좋게 나타내는 각종 웹사이트가 경쟁적으로 나타났고 그 덕분에 서비스 초반에는 API가 먹통이 되기도 했습니다. 모두 동일한 API를 활용하기에 실제와 데이터의 괴리를 현장에서 직접 조사하며 바로잡을 게 아니라면 동일한 내용물에.. 2020. 7. 12.
#43.나.시.브라질 동시대를 살아가는 장삼이사(張三李四), 필부필부(匹夫匹婦) 글쓴이들이 무슨 생각을 가지고 있는지 궁금한 마음에 시작한 프로젝트입니다. 별다른 해석은 없을 예정이지만 최근의 트렌드가 궁금하셨거나, 글감이 필요했던 분들께 마중물이 된다면 좋겠습니다. 추석 연휴에도 누군가는 이야기하고 싶었다. [브런치로 세상 읽기] #38.하다.사랑.여행 [브런치로 세상 읽기] #39.스타트업.조국.인공지능 [브런치로 세상 읽기] #40.조커.영화.여행 [브런치로 세상 읽기] #41.소설.판타지.있다 [브런치로 세상 읽기] #42.에세이.하다.책 그림(figure)으로 브런치 읽기 수 주째 한가운데 자리 잡았던 #여행 대신 대중이 #나에 대해 좀 더 집중한 주였다. 43주차의 온도 전반적으로 밝은 색상을 보이는데, 단순히 분.. 2019. 10. 29.
프로듀스 101 시즌2 - 4화 분석 빅데이터도 스몰데이터부터 이전 글에 이은 후속 분석(?)입니다. ※ 방송 내용과는 크게 관계없는 '잡담' 데이터에 대한 주관적인 분석 내용입니다. 프로그램 관련 정보를 찾아서 오신 분들은 공식 홈페이지에서 더 자세한 내용을 :) 엠넷의 방송 직전인 목요일(28일) 오후 10시까지 2만 건의 버즈 분석입니다. - 수집 기간 : 2017-04-23 15:54:45 ~ 2017-04-28 22:11:54 - 데이터 수량 : 중복 제외 11,203건 (총 183,694자) 그리고 대망의 방송 후반부 & 직후! (방송 시작 시각부터 수집하려고 했으나 데이터가 폭증하는 바람에 실패) - 수집 기간 : 2017-04-29 00:38:02 ~ 2017-04-29 01:12:51 - 데이터 수량 : 33,230건 중 중.. 2019. 10. 26.
버즈분석으로 미래 예측이 가능할까? [빅데이터도 스몰데이터부터] 실생활에서 직접 활용해볼 수 있는 데이터마이닝/데이터과학/프로그래밍의 응용편입니다. 무척 피곤한 하루를 보내고 멍하니 TV를 보다가 그러다 문득 '인터넷(SNS/게시판/댓글 등등)의 반응으로 순위를 가늠해볼 수 있지 않을까'라는 생각이 들더군요. 여타 오디션 예능프로그램과는 다르게 시청자들의 투표를 통해 순위가 가려지는 만큼, 인구(人口)에 회자되는 출연자가 높은 순위를 얻을 수 있을 것 같았습니다. (가설1) ※ 버즈분석(Buzz Analytics) 버즈 데이터는 흔히 말하는 빅 데이터와 그 실체가 같다. 다만, 버즈 데이터 혹은 소셜 버즈 데이터라고 부를 때에는 마케팅을 목적으로 해서, 수집하고 분석한다는 뉘앙스가 강하다. 아무튼 그 통계 분석 결과를 클라이언트가 쉽게 알.. 2019. 10. 26.
#42.에세이.하다.책 동시대를 살아가는 장삼이사(張三李四), 필부필부(匹夫匹婦) 글쓴이들이 무슨 생각을 가지고 있는지 궁금한 마음에 시작한 프로젝트입니다. 별다른 해석은 없을 예정이지만 최근의 트렌드가 궁금하셨거나, 글감이 필요했던 분들께 마중물이 된다면 좋겠습니다. 추석 연휴에도 누군가는 이야기하고 싶었다. [브런치로 세상 읽기] #38.하다.사랑.여행 [브런치로 세상 읽기] #39.스타트업.조국.인공지능 [브런치로 세상 읽기] #40.조커.영화.여행 [브런치로 세상 읽기] #41.소설.판타지.있다 그림(figure)으로 브런치 읽기 42주차의 온도 왜인지 규칙성 없이 산재되어 있던 발행 분포가 주중(일과/업무시간)으로 수렴하는 모양새다. 제일 밝은 칸으로 나타난 화요일 17시경에 특별한 이벤트가 있었나 찾아봤지만 특이사항.. 2019. 10. 23.
#41.소설.판타지.있다 동시대를 살아가는 장삼이사(張三李四), 필부필부(匹夫匹婦) 글쓴이들이 무슨 생각을 가지고 있는지 궁금한 마음에 시작한 프로젝트입니다. 별다른 해석은 없을 예정이지만 최근의 트렌드가 궁금하셨거나, 글감이 필요했던 분들께 마중물이 된다면 좋겠습니다. 추석 연휴에도 누군가는 이야기하고 싶었다. [브런치로 세상 읽기] #38.하다.사랑.여행 [브런치로 세상 읽기] #39.스타트업.조국.인공지능 [브런치로 세상 읽기] #40.조커.영화.여행 그림(figure)으로 브런치 읽기 41주차의 온도 직전주차(左), 41주차(右) 한주간의 브런치 한줄(?)로 읽기 보라 - 빨강 = 파랑 19.41.58 "#소설#판타지#있다#부산국제영화제#성공#세금#한글날#하다#말다#시간#스타트업#인생#한글#날#어른#편지#겨울#싶다#화#장.. 2019. 10. 22.
#40.조커.영화.여행 동시대를 살아가는 장삼이사(張三李四), 필부필부(匹夫匹婦) 글쓴이들이 무슨 생각을 가지고 있는지 궁금한 마음에 시작한 프로젝트입니다. 별다른 해석은 없을 예정이지만 최근의 트렌드가 궁금하셨거나, 글감이 필요했던 분들께 마중물이 된다면 좋겠습니다. 추석 연휴에도 누군가는 이야기하고 싶었다. [브런치로 세상 읽기] #38.하다.사랑.여행 [브런치로 세상 읽기] #39.스타트업.조국.인공지능 그림(figure)으로 브런치 읽기 40주차의 온도 40주차(左), 직전주차(右) 한주간의 브런치 한줄(?)로 읽기 보라 - 빨강 = 파랑 19.40.60 "조커영화여행리뷰나퇴사시작아이에세이월삶육아에세이영국승무원그림일기때글쓰기마음너우리연애내뭐달쓰다프랑스예술것심리수이야기차관계영화리뷰워킹맘육아방법유럽여행못하다음식민주주의한만들.. 2019. 10. 22.
#39.스타트업.조국.인공지능 시대를 살아가는 장삼이사(張三李四), 필부필부(匹夫匹婦) 글쓴이들이 무슨 생각을 가지고 있는지 궁금했다. 이전 글 추석 연휴에도 누군가는 이야기하고 싶었다. [브런치로 세상 읽기] #38.하다.사랑.여행 그림(figure)으로 브런치 읽기 39주차의 온도 이전보다 더 추세 없이 들쑥날쑥한 모습이다. 39주차(左), 직전주차(右) 한주간의 브런치 한줄(?)로 읽기 파랑 - 빨강 = 보라 19.39.55 "스타트업조국인공지능행복날영화부부검찰개혁시일러스트슬프다와인보다운동영어촛불집회성장위로검찰공감에세이가다숨바꼭질국수커피저편인터뷰지나다프로젝트100놀이가을알다글이별오늘찾다여성술소설먹다여자우주화어머니아름답다반려견프롤로그정의관하다신로봇밀다회사투자학교사고인문학맞다모집독서모임할리우드조커마방문객아토피시간아빠임신프로젝트그대직.. 2019. 10. 22.
주차장에 내 자리 있나요?(2/3) ※ 이전글에서 이어집니다. 찰나의 데이터로는 현재 상태를 확인하는 것 외에 원하던 결과를 얻지 못했습니다. 데이터 없이 미래를 '예측'할 수 있는 묘수가 있는 건 아니니 계속해서 데이터를 모았습니다. (글을 쓰는 현재까지 보름 정도 PC를 켜두고 코드를 동작시키고 있습니다.) 4시간이 아니라 4일 하고도 23시간 44분 모은 데이터를 불러옵니다. 저장 형태는 32->64->96->...->3200처럼 늘어났고 모은 데이터 전체를 붙여서(bind) 10회당 한 번꼴로 엑셀파일로 저장되게 했는데, 중간중간 멈추고 끊기는 경우가 있어서 파일이 파편화됐습니다. 여러 조각으로 나눠지거나 여러 사람이 작업한 파일을 하나로 합치는 방법은 간단하게 생각하면 데이터 프레임을 하나 만들고, 파일을 하나씩 불러들여서 행(r.. 2019. 10. 22.
주차장에 제 자리 있나요? (1/3) 며칠 뒤 서울 시내에 갈 일이 생겼습니다. 차를 가지고요. 교통 체증이야 각오하고, 차를 주차할 자리가 있는지부터 알아봅니다. 지도 앱으로 찾아보니 목적지 근방에 사설 주차장이 있긴 한데 시내 요지라 그런지 요금이 만만치가 않습니다. 주변부까지 조금 더 검색범위를 넓혀보니 걸어갈 만한 거리에 공영주차장이 있었습니다. 주차요금은 절반에서 1/4정도 되네요. 공영주차장은 웹사이트를 통해 주차 가능대수가 실시간으로 조회되기까지 하니 좋습니다. (2019년 8월 현재 32개소) https://www.sisul.or.kr/open_content/parking/guidance/useable.jsp 실시간 주차가능 대수 확인 참 좋은 기능인데 정작 며칠 뒤에 상황이 어찌 변할지 모르고, 당일에 출발하면서 확인하고 가.. 2019. 10. 22.
[생활 속 데이터분석] 인구통계 뉴스는 정말 맞을까? 10월 11일자 저녁 뉴스 [사실은] '갈라진 광장' 들여다보니…둘 다 외면한 '20대' 에서 출발하는 이야기다. 20대가 왜? 짧은 리포트에서 분석과정을 설명할 순 없었겠지만 20대 수치가 광화문 0.9%, 서초동 5.7%라는 건 무슨 말인가 싶었다. 정치적 이슈는 논외로, 숫자의 의미를 살펴보고자 했다. 뉴스에서 알려준대로 서울시 생활인구 통계 데이터를 받아봤다. 일(日)별 80MB 내외, 데이터 수량으로는 45~46만줄 정도 되는 걸 알 수 있다. 전년도, 전전년도까지 찾아서 사용한 데이터는 다음과 같다. [1] "LOCAL_PEOPLE_20170929.csv" "LOCAL_PEOPLE_20170930.csv" "LOCAL_PEOPLE_20171001.csv" "LOCAL_PEOPLE_2017100.. 2019. 10. 22.
#38.하다.사랑.여행 동시대를 살아가는 장삼이사(張三李四), 필부필부(匹夫匹婦) 글쓴이들이 무슨 생각을 가지고 있는지 궁금했다. (※ 참고 : 추석 연휴에도 누군가는 이야기하고 싶었다.) 그림(figure)으로 브런치 읽기 백문이불여일견. 38주차의 온도 월요일 점심 직후와 퇴근시간 무렵에 호황을 이루고 주중 불규칙한 발행에 이어 토요일은 한동안 소강상태. 일요일은 오후부터 글이 늘어 하루의 끝에 가장 많은 글이 세상에 나왔다. 한주간의 브런치 한줄(?)로 읽기 파랑 - 빨강 = 보라 19.38.57 "하다사랑여행나있다사람가을것년음악마음호텔되다싶다생각좋다에세이감성에세이위하다엄마장월직장인대임신일상시그림꿈변화글쓰기공감에세이인생한이유없다클래식가다가지일기일본베트남계절세계말사진제주필사영화스타트업프로젝트잠언독서다이어트세상습관직장생활노래.. 2019. 10. 22.