- National Petition Analysis
- 개요
- 국민청원 청민관련 뉴스
- 데이터
- 분류별 청원 숫자
- 월별 청원 숫자
- 데이터 해석
- 데이터 분석
- 분야별 청원의 추천 그래프 화
- 30개까지의 분야별 데이터 그래프
- 100개까지의 분야별 데이터 그래프 (x y)
- 분야별 분석 결과
- 월별 청원의 추천 그래프 화
- 30개까지의 월별 데이터 그래프
- 100개까지의 월별 데이터 그래프
- 월별 분석 결과
- 워드클라우드
- 분야별 워드클라우드
- 월별 워드클라우드
- 네트워크 Old 청치개혁 Top 50
- 네트워크 제작 설명
- 내용 지정
- 단어 뽑기
- 페어화
- Data Frame 제작
- 필터링
- 네트워크 예시
- 가짜
- 김상돈
- 문재인
- 이재명
- 정의
- 특검
- 네트워크 해석
- 네트워크 브리핑
- 네트워크 예시
- 심신
- 조두순
- 난민
- 비서
- 뉴미디어
- 음주운전
- 피해자
- 네트워크 Top 1000
- 네트워크 예시
- 여성
- 살인자
- 무슬림
- 교사
- 어린이집
- 전용
- 인스타
- 일베
- 인증
- 정부의 관심사 알아보기
- 답변한 청원 정리
- 달별 답변 수
- 답변 정리
- 답변 워드클라우드
- 청원 키워드 Top 15
- 답변 키워드 Top 15
- 전체에 대한 키워드 Top 30
- 국민의 관심사 알아보기
- 추천수 별 개수
- 워드클라우드
- 추천 수 0개 키워드
- 1~2개 추천 키워드
- 3~5개 추천 키워드
- 6~10개 추천 키워드
- 11~20개 추천 키워드
- 21~40개 추천 키워드
- 41~100개 추천수를 가진 청원에서 많이 등장한 단어
- 100개 이상의 추천수를 가진 청원에서 많이 등장한 단어
- 특이한 점
- 찾은 계기
- 그래프화
- 해석
- 중요 키워드 정리
- 군대
- 네트워크
- 워드클라우드
- Top 키워드
- 해석
- 서민
- 네트워크
- 워드클라우드
- Top 키워드
- 해석
- 소통
- 네트워크
- 워드클라우드
- Top 키워드
- 해석
- 성장
- 네트워크
- 워드클라우드
- Top 키워드
- 해석
- 탄핵
- 네트워크
- 워드클라우드
- Top 키워드
- 해석
- 경제
- 네트워크
- 워드클라우드
- Top 키워드
- 해석
- 북한
- 네트워크
- 워드클라우드
- Top 키워드
- 해석
- 국회의원
- 네트워크
- 워드클라우드
- Top 키워드
- 필터링한 Top 키워드
- 해석
- 대통령
- 네트워크
- 워드클라우드
- Top 키워드
- 해석
- 대기업
- 네트워크
- 워드클라우드
- Top 키워드
- 해석
- 갑질
- 네트워크
- 워드클라우드
- Top 키워드
- 해석
- 소고
- 소통
- 서민
- 4차 산업혁명
- 혁신
- 군대
- 갑질
- 경제
- 북한
- 미래
- Connect
Visible to everyone at com-lab
개요
국민청원 청민관련 뉴스
데이터
분류별 청원 숫자
경제민주화 : 15,870
안전,환경 : 29,098
보건복지 : 23,170
반려동물 : 3,752
교통,건축,국토 : 26,517
농산어촌 : 1,734
저출산/고령화대책 : 3,407
외교,통일,국방 : 25,277
인권/성평등 : 33,035
문화,예술,체육,언론 : 16,942
성장동력 : 6,853
기타 : 45,658
정치개혁 : 57,865
육아,교육 : 24,569
일자리 : 21,593
미래 : 16,852
행정 : 19,038
all : 371,230
월별 청원 숫자
2017-08 : 1,171
2017-09 : 17,040
2017-10 : 5,930
2017-11 : 29,425
2017-12 : 18,377
2018-01 : 31,251
2018-02 : 25,696
2018-03 : 21,624
2018-04 : 23,044
2018-05 : 25,254
2018-06 : 25,387
2018-07 : 25,772
2018-08 : 27,783
2018-09 : 23,916
2018-10 : 25,740
2018-11 : 23,360
2018-12 : 20,125
2019-01 : 335
avg : 19,538.42
all : 371,230
데이터 해석
데이터 분석
분야별 청원의 추천 그래프 화
from sklearn import preprocessing
x = df.values #returns a numpy array
min_max_scaler = preprocessing.MinMaxScaler()
x_scaled = min_max_scaler.fit_transform(x)
dfs = pd.DataFrame(x_scaled, columns= names)
dfs
분야별 분석 결과
월별 청원의 추천 그래프 화
월별 분석 결과
2017-11 : 29425
2017-11-11 : 9614
정치개혁 : 10488
워드클라우드
분야별 워드클라우드
df = df[df["conut"]>100]
월별 워드클라우드
네트워크 Old 청치개혁 Top 50
네트워크 제작 설명
#정치개혁 데이터의 상위 50개
df = df[df["category"]=="정치개혁"]
df = df.sort_values(by="count",ascending=False)
df = df.reset_index()
df = df[:50]
test = []
for index, row in df.iterrows():
tokens_ko = t.nouns(row["petition_overview"])
stop_words = ['대한', '여러','알', '곳', '더','또한','우리','통해','내', '나','사진','너','응','음' , '사진','알수없음','회원','월','일','년','오후','오전','로','한','와','의','중','가지','안','후','위해','정도','등', '자','를','직','제','저', '이','그','때','및','것이','합니다.','\\n',':','','거','수','그' ,"합","이","있는","있습니다.","것","및","하지만","때문에"]
tokens_ko = [each_word for each_word in tokens_ko if each_word not in stop_words]
ko = nltk.Text(tokens_ko, name= 'my')
test.append(ko.vocab().most_common(50))
tests = []
source = []
target = []
sources = []
targets = []
num = []
for i in range(50):
for t1 in test[i]:
for t2 in test[i]:
if(t1!=t2):
source.append(t1[0])
target.append(t2[0])
num.append(t1[1] * t2[1])
for _ in range(t1[1] * t2[1]):
sources.append(t1[0])
targets.append(t2[0])
tests.append((t1[0],t2[0]))
from collections import OrderedDict
sales = OrderedDict([ ('source', sources),
('target', targets) ] )
test_df = pd.DataFrame.from_dict(sales)
[('국회', '언제'),
('국회', '봐'),
('국회', '이유'),
('국회', '납득'),
('국회', '가면'),
('국회', '도대체'),
('국회', '야당'),
('국회', '행태'),
('국회', '열'),
...
def find_dfs(df_t, word, num):
test = df_t[df_t['Pair'].apply(lambda x: fine_word(x,word))]
for i,t in test[:num*2].iterrows():
f_word = t['Pair'][t['Pair'].find(word)+len(word):]
result = hangul.sub('', f_word)
if(result):
print(result, t["Num"])
find_dfs(df_t, "영종",10)
네트워크 예시
네트워크 해석
네트워크 브리핑
네트워크 예시
네트워크 Top 1000
네트워크 예시
정부의 관심사 알아보기
추천이 20만번 이상이여도 답변을 하지 않은 청원 찾기답변한 청원 정리
보건복지 : 3
반려동물 : 3
육아/교육 : 2
기타 : 7
인권/성평등 : 21
안전/환경 : 8
성장동력 : 2
미래 : 1
교통/건축/국토 : 2
문화/예술/체육/언론 : 7
행정 : 1
정치개혁 : 5
외교/통일/국방 : 4
경제민주화 : 2
all : 68
2017-08 : 0
2017-09 : 3
2017-10 : 0
2017-11 : 3
2017-12 : 2
2018-01 : 7
2018-02 : 7
2018-03 : 6
2018-04 : 5
2018-05 : 8
2018-06 : 7
2018-07 : 3
2018-08 : 0
2018-09 : 2
2018-10 : 12
2018-11 : 3
2018-12 : 0
all : 68
답변 워드클라우드
청원 키워드 Top 15
{'피해자': 138,
'사람': 124,
'국민': 110,
'생각': 97,
'가해자': 91,
'사건': 87,
'아이': 87,
'법': 79,
'링크': 66,
'처벌': 64,
'일': 62,
'첨부': 60,
'동생': 59,
'인증': 58}
답변 키워드 Top 15
{'청원': 660,
'국민': 466,
'비서': 444,
'사건': 367,
'처벌': 348,
'정혜승': 344,
'피해자': 313,
'범죄': 236,
'정부': 235,
'수사': 213,
'법': 206,
'불법': 206,
'뉴미디어': 205,
'문제': 200,
'센터': 198}
전체에 대한 키워드 Top 30
{'청원': 714,
'국민': 576,
'사건': 454,
'피해자': 451,
'비서': 444,
'처벌': 412,
'정혜승': 344,
'법': 285,
'범죄': 274,
'정부': 256,
'문제': 246,
'생각': 244,
'보호': 240,
'수사': 237,
'불법': 233}
국민의 관심사 알아보기
추천수 별 개수
워드클라우드
추천 수 0개 키워드
{'폐지': 6,807,
'이명박': 5,917,
'법': 5,095,
'출국금지': 4,846,
'청소년': 4,585,
'반대': 3,974,
'조두순': 3,218,
'청원': 3,200,
'보호': 2,886,
'소년법': 2,190,
'대통령': 1,656,
'화폐': 1,521,
'가상': 1,421,
'금지': 1,366,
'국민': 1,345}
1~2개 추천 키워드
{'청원': 4,760,
'폐지': 4,278,
'법': 3,147,
'이명박': 2,823,
'국민': 2,715,
'대통령': 2,367,
'출국금지': 2,205,
'반대': 2,140,
'청소년': 1,851,
'화폐': 1,756,
'처벌': 1,586,
'요청': 1,575,
'가상': 1,571,
'정부': 1,513,
'보호': 1,450}
3~5개 추천 키워드
{'청원': 4,512,
'국민': 2,890,
'폐지': 2,774,
'대통령': 2,316,
'처벌': 2,043,
'법': 1,938,
'반대': 1,740,
'정부': 1,720,
'화폐': 1,463,
'대한민국': 1,341,
'요청': 1,323,
'문재인': 1,292,
'가상': 1,279,
'공무원': 1,203,
'개선': 1,179}
6~10개 추천 키워드
{'청원': 3,889,
'국민': 2,785,
'폐지': 2,504,
'대통령': 2,303,
'처벌': 2,182,
'반대': 1,665,
'정부': 1,627,
'법': 1,581,
'문재인': 1,462,
'대한민국': 1,227,
'요청': 1,126,
'국민연금': 1,111,
'공무원': 1,096,
'화폐': 1,071,
'부동산': 1,003}
11~20개 추천 키워드
{'청원': 3,199,
'국민': 2,771,
'폐지': 2,445,
'처벌': 2,207,
'대통령': 2,133,
'반대': 1,688,
'문재인': 1,579,
'국민연금': 1,454,
'정부': 1,436,
'법': 1,318,
'국회의원': 1,274,
'부동산': 1,130,
'공무원': 1,054,
'요청': 1,015,
'대한민국': 1,015}
21~40개 추천 키워드
{'폐지': 2,393,
'청원': 2,265,
'국민': 1,943,
'반대': 1,657,
'처벌': 1,615,
'대통령': 1,590,
'난민': 1,262,
'국민연금': 1,251,
'국회의원': 1,236,
'문재인': 1,191,
'정부': 1,008,
'법': 918,
'사건': 910,
'부동산': 874,
'요청': 798}
41~100개 추천수를 가진 청원에서 많이 등장한 단어
{'난민': 2,071,
'청원': 1,863,
'폐지': 1,829,
'반대': 1,502,
'국민': 1,325,
'처벌': 1,306,
'국회의원': 1,064,
'사건': 980,
'법': 826,
'조사': 779,
'대통령': 743,
'국민연금': 698,
'요청': 684,
'폭행': 581,
'문재인': 517}
100개 이상의 추천수를 가진 청원에서 많이 등장한 단어
{'청원': 1,874,
'처벌': 1,425,
'폐지': 1,044,
'반대': 965,
'사건': 941,
'요청': 808,
'조사': 786,
'국민': 694,
'국회의원': 592,
'법': 561,
'폭행': 473,
'수사': 467,
'난민': 408,
'대통령': 407,
'대한항공': 380}
특이한 점
t_0 = ["이명박", "출국금지", "조두순","가상","화폐"] #추천이 0개인 키워드
t_100 = ["난민", "폭행", "처벌", "국회의원", "대한항공"] #추천이 100개 이상인 키워드
t_a = ["국민", "처벌", "대통령","청원","폐지"] #여러 추천에서 나오는 키워드
중요 키워드 정리
군대
{'병원': 105982,
'아들': 32482,
'군': 18564,
'일병': 7852,
'군대': 4053,
'치료': 2265,
'의사': 2097,
'에이즈': 2020,
'환자': 1764,
'아이': 1694,
'간호사': 1507,
'재활': 1358,
'사망': 1327,
'의료': 1120,
'학생': 1099}
서민
{'분양': 73480,
'공사': 30061,
'전환': 29546,
'서민': 28105,
'주택': 23365,
'건설': 3784,
'임대': 3231,
'공급': 2861,
'택지': 2820,
'국토부': 2771,
'집': 2541,
'주거': 2278,
'국가': 2237,
'감정': 2166,
'가액': 2007}
소통
{'교육': 251422,
'학교': 147493,
'노동': 21184,
'교사': 18094,
'비정규직': 14778,
'학생': 12090,
'노동자': 10006,
'교장': 4744,
'사회': 4400,
'영양사': 3642,
'사람': 3528,
'업무': 3507,
'공무원': 3489,
'무슬림': 3380,
'정부': 3180}
성장
{'책': 38416,
'주식시장': 19888,
'국민연금': 13215,
'구매': 10820,
'대여': 8744,
'성장': 3352,
'공매도': 2892,
'불법': 1907,
'주식': 1796,
'감소': 1512,
'도서': 1457,
'출판': 1455,
'서점': 1358,
'국민': 1151,
'투자자': 1087}
탄핵
{'국민': 488614,
'대통령': 85140,
'청원': 84869,
'국회의원': 11394,
'여성': 10782,
'국회': 9146,
'대한민국': 7301,
'난민': 6767,
'정부': 6728,
'국가': 6232,
'사람': 6051,
'한국': 4588,
'정책': 4327,
'사회': 4059,
'외국인': 3833}
경제
{'사람': 260874,
'한국': 227097,
'공매도': 98681,
'나라': 88488,
'무슬림': 63252,
'경제': 30775,
'사회': 11832,
'국민': 9695,
'이민자': 9328,
'이민': 8532,
'아랍': 8261,
'여성': 8145,
'난민': 7813,
'교육': 7676,
'생각': 7349}
북한
{'국민': 491559,
'정부': 146082,
'대한민국': 113732,
'여성': 16009,
'합의': 13617,
'난민': 8176,
'국가': 8111,
'북한': 7029,
'사람': 6807,
'정책': 5592,
'지원': 5453,
'남성': 5433,
'한국': 4589,
'대통령': 4490,
'무고': 4480,
'외국인': 4377}
국회의원
{'국민': 244165,
'요구': 77475,
'의원': 57999,
'자료': 19488,
'제출': 16013,
'국회의원': 12196,
'여성': 8529,
'정부': 4545,
'대한민국': 3946,
'국가': 3633,
'난민': 3587,
'사람': 3167,
'남성': 2922,
'법': 2877,
'지원': 2724}
{'피해자': 2420,
'위원회': 2365,
'무고': 2245,
'사건': 2050,
'대통령': 1921,
'외국인': 1917,
'교사': 1721,
'처벌': 1708,
'인권': 1635,
'공매도': 1623,
'성폭력': 1585,
'경찰': 1503,
'미세먼지': 1500,
'여자': 1400,
'성폭행': 1375,
'의료': 1374,
'성범죄': 1365}
대통령
{'국민': 497863,
'여성': 319555,
'사람': 264325,
'정부': 150289,
'한국': 117601,
'대통령': 87718,
'남성': 19163,
'사회': 16075,
'국가': 13518,
'대한민국': 13434,
'정책': 11676,
'남자': 11659,
'무고': 11597,
'지원': 10648,
'피해자': 10529}
대기업
{'저희': 129118,
'기술': 26899,
'대기업': 10173,
'특허': 7896,
'텔레콤': 6876,
'패션': 5786,
'사건': 2910,
'아이': 1677,
'둘째딸': 1666,
'딸': 1578,
'아빠': 1571,
'소송': 1521,
'병원': 1317,
'침해': 1207,
'엄마': 1138,
'중소기업': 1113}
갑질
{'국민': 244654,
'말': 217367,
'병원': 107206,
'업체': 48050,
'여성': 9752,
'승무원': 8159,
'사람': 7112,
'갑질': 4138,
'대한민국': 4121,
'아이': 4027,
'생각': 3959,
'정부': 3764,
'국가': 3732,
'사건': 3520,
'치료': 3460,
'의사': 3374,
'피해자': 3270}
소고
소통
서민
4차 산업혁명
혁신
군대
갑질
경제
북한
미래
Connect
# github : https://github.com/newhiwoong
# email : newhiwoong@gmail.com