분석4 프로듀스 101 시즌2 - 4화 분석 빅데이터도 스몰데이터부터 이전 글에 이은 후속 분석(?)입니다. ※ 방송 내용과는 크게 관계없는 '잡담' 데이터에 대한 주관적인 분석 내용입니다. 프로그램 관련 정보를 찾아서 오신 분들은 공식 홈페이지에서 더 자세한 내용을 :) 엠넷의 방송 직전인 목요일(28일) 오후 10시까지 2만 건의 버즈 분석입니다. - 수집 기간 : 2017-04-23 15:54:45 ~ 2017-04-28 22:11:54 - 데이터 수량 : 중복 제외 11,203건 (총 183,694자) 그리고 대망의 방송 후반부 & 직후! (방송 시작 시각부터 수집하려고 했으나 데이터가 폭증하는 바람에 실패) - 수집 기간 : 2017-04-29 00:38:02 ~ 2017-04-29 01:12:51 - 데이터 수량 : 33,230건 중 중.. 2019. 10. 26. 버즈분석으로 미래 예측이 가능할까? [빅데이터도 스몰데이터부터] 실생활에서 직접 활용해볼 수 있는 데이터마이닝/데이터과학/프로그래밍의 응용편입니다. 무척 피곤한 하루를 보내고 멍하니 TV를 보다가 그러다 문득 '인터넷(SNS/게시판/댓글 등등)의 반응으로 순위를 가늠해볼 수 있지 않을까'라는 생각이 들더군요. 여타 오디션 예능프로그램과는 다르게 시청자들의 투표를 통해 순위가 가려지는 만큼, 인구(人口)에 회자되는 출연자가 높은 순위를 얻을 수 있을 것 같았습니다. (가설1) ※ 버즈분석(Buzz Analytics) 버즈 데이터는 흔히 말하는 빅 데이터와 그 실체가 같다. 다만, 버즈 데이터 혹은 소셜 버즈 데이터라고 부를 때에는 마케팅을 목적으로 해서, 수집하고 분석한다는 뉘앙스가 강하다. 아무튼 그 통계 분석 결과를 클라이언트가 쉽게 알.. 2019. 10. 26. #39.스타트업.조국.인공지능 시대를 살아가는 장삼이사(張三李四), 필부필부(匹夫匹婦) 글쓴이들이 무슨 생각을 가지고 있는지 궁금했다. 이전 글 추석 연휴에도 누군가는 이야기하고 싶었다. [브런치로 세상 읽기] #38.하다.사랑.여행 그림(figure)으로 브런치 읽기 39주차의 온도 이전보다 더 추세 없이 들쑥날쑥한 모습이다. 39주차(左), 직전주차(右) 한주간의 브런치 한줄(?)로 읽기 파랑 - 빨강 = 보라 19.39.55 "스타트업조국인공지능행복날영화부부검찰개혁시일러스트슬프다와인보다운동영어촛불집회성장위로검찰공감에세이가다숨바꼭질국수커피저편인터뷰지나다프로젝트100놀이가을알다글이별오늘찾다여성술소설먹다여자우주화어머니아름답다반려견프롤로그정의관하다신로봇밀다회사투자학교사고인문학맞다모집독서모임할리우드조커마방문객아토피시간아빠임신프로젝트그대직.. 2019. 10. 22. [생활 속 데이터분석] 인구통계 뉴스는 정말 맞을까? 10월 11일자 저녁 뉴스 [사실은] '갈라진 광장' 들여다보니…둘 다 외면한 '20대' 에서 출발하는 이야기다. 20대가 왜? 짧은 리포트에서 분석과정을 설명할 순 없었겠지만 20대 수치가 광화문 0.9%, 서초동 5.7%라는 건 무슨 말인가 싶었다. 정치적 이슈는 논외로, 숫자의 의미를 살펴보고자 했다. 뉴스에서 알려준대로 서울시 생활인구 통계 데이터를 받아봤다. 일(日)별 80MB 내외, 데이터 수량으로는 45~46만줄 정도 되는 걸 알 수 있다. 전년도, 전전년도까지 찾아서 사용한 데이터는 다음과 같다. [1] "LOCAL_PEOPLE_20170929.csv" "LOCAL_PEOPLE_20170930.csv" "LOCAL_PEOPLE_20171001.csv" "LOCAL_PEOPLE_2017100.. 2019. 10. 22. 이전 1 다음