• 제목/요약/키워드: 글

검색결과 4,724건 처리시간 0.035초

K-means 클러스터링과 토픽 모델링을 기반으로 한 국민청원 사이트의 카테고리 재구성 (Reconstruction of Categories on the National Petition Site Using K-Means clustering and Topic Modeling)

  • 우윤희;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.302-305
    • /
    • 2019
  • 국민 청원 사이트가 뛰어난 접근성과 신속성으로 인하여 국민들로부터 많은 관심을 받고 있다. 현재 국민청원 사이트의 카테고리 분류는 '미래', '성장동력' 등을 포함한 16개의 카테고리 및 기타로 구성되어 있으나 그 기준이 모호하여 많은 청원글들이 기타 카테고리로 분류되고 있는 상황이다. 이는 청원글의 내용을 명확히 반영하지 않고 미리 정의된 카테고리 구조를 사용하고 있는데서 기인한다고 할 수 있다. 본 논문에서는 보다 구체적으로 정의된 카테고리를 정의하고자 추천 순으로 1,500개의 청원글을 수집하였고, 수집된 청원글의 내용을 바탕으로 카테고리 구조를 추출하였다. 먼저, k-평균 알고리즘을 적용하여 청원글을 군집하여 대분류를 정의하였고, 보다 구체적인 세부 분류를 정의하기 위하여 토픽모델링을 실시하였다. 본 논문에서 제시하는 계층적 카테고리 구조는 청원글의 내용을 바탕으로 대분류와 세부분류로 구성된 것이므로 새로운 청원글을 등록하거나 분류하는 데 적절한 것으로 보인다.

진정한 기업가정신이 만드는 건강한 사회

  • 전흥윤
    • 벤처다이제스트
    • /
    • 통권57호
    • /
    • pp.21-21
    • /
    • 2004
  • 지난 55호에 실린‘노블리스 오블리주’전흥윤(사회복지공동모금회 홍보팀장) 필자의 글을 읽고 벤처기업 엔지뱅크 신현재 대표가 소감의 글을 보내 주셨습니다. 독자들과 함께 나눠볼만한 내용이라는 판단으로 신현재 대표의 글 전문과 다시 한번 의견을 주신 전흥윤 팀장의 글을 나란히 함께 싣습니다. 두 필자분들께 감사를 드리며, 기업의 사회공헌활동에 대한 심도있는 의견교환을 위해 언제나 여러분의 참여를 환영합니다

  • PDF

초.중등 과학 교과서 화산과 지진 관련 단원 글의 언어 구조 비교 분석 (A Comparative Analysis of the Linguistic Features of Texts used in the unit of Volcano and Earthquake in Korean Elementary and Secondary School Science Textbooks)

  • 신명환;맹승호;김찬종
    • 한국지구과학회지
    • /
    • 제31권1호
    • /
    • pp.36-50
    • /
    • 2010
  • 이 연구의 목적은 초 중 고등학교 과학 교과서 글의 구조적 특징을 종합적으로 분석하여 학생들이 상급 학교로 진학하면서 경험하게 되는 과학 교과서 글의 변화 양상을 살펴보는 것이다. 연구 자료로 제 7차 교육 과정에 의해 개발된 초 중 고등학교 과학 교과서의 '화산과 지진' 관련 단원의 글을 선정하였으며, '텍스트 구성적 의미', '상호 관계적 의미', '내용과 논리 관계 의미'의 측면에서 글을 비교 분석하였다. 연구 결과, 과학 교과서의 글은 학교급에 따라 글의 구조를 비롯한 언어적 특징이 다르게 나타나며, 학생들이 상급 학교로 진학하면서 이러한 글의 구조적 특징 차이에 의해서도 과학 교과서를 읽고 이해하는 것이 어렵고 생소하다고 인식할 수 있음을 문제로 제기하였다. 또한 과학을 학습하는 과정에서 과학의 언어가 지니는 구조적 특징에 대한 과학 교사의 중재자 역할이 필요함을 제안하였다.

논의활동이 초등학생의 과학글쓰기에 미치는 영향 (The Influence of Argumentation on the Scientific Writing of Elementary School Students)

  • 강묘정;공영태
    • 과학교육연구지
    • /
    • 제38권2호
    • /
    • pp.286-301
    • /
    • 2014
  • 이 연구의 목적은 초등학생의 논의활동과 과학글쓰기와의 상호 관련성을 정성적으로 알아보는데 있다. 이와 같은 과제를 해결하기 위하여 과학적 상황 및 사회과학적 상황으로 구성된 9가지 논의 및 과학글쓰기 주제를 가지고 초등학교 5학년 학생을 대상으로 논의 및 과학글쓰기 활동을 행하였다. 논의과정에서 나눈 대화내용과 논의활동 전 후에 작성한 과학글쓰기의 내용을 녹음하고 전사하여 과학 글쓰기 세 가지 목표영역에 준거한 분석틀에 따라 비교 분석하였다. 이번 연구를 통하여 얻어진 결과는 다음과 같다. 첫째, 논의활동 중의 다양한 의견들은 논의 후 과학글쓰기에서 과학글쓰기 3가지 목표영역인 과학성, 논리성, 창의성이 신장되는데 긍정적인 효과를 주었다. 둘째, 논의활동이 논의 후 과학글쓰기에 나타나는 표현 형태는 크게 세 가지로 범주화할 수 있었다. 유형 1) 논의과정에서 새롭게 드러난 자신의 과학개념, 주장, 아이디어를 보충하여 표현하는 경우, 유형 2) 논의과정에서 다른 사람의 과학개념, 주장, 근거, 아이디어를 자기화하여 나타내는 경우, 유형 3) 논의활동에 기초하여 새로운 사실을 추론하거나 새로운 아이디어를 표현하는 경우이다.

  • PDF

KoCheckGPT: 한국어 초거대언어모델 작성 글 판별기 (KoCheckGPT: Korean LLM written document detector)

  • 강명훈;이정섭;이승윤;홍성태;박정배;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.432-436
    • /
    • 2023
  • 초거대언어모델(LLM)의 도래에 따라 다양한 과업들이 도메인 관계 없이 제로샷으로 추론이 가능해짐에 따라서 LLM이 다양한 산업분야에 적용되고 있다. 대표적으로 ChatGPT와 GPT-4는 상용 API로 서비스를 제공하여 용이한 서비스 접근으로 다양한 이용층을 끌어들이고 있다. 그러나 현재 상용 API로 제공되고 있는 ChatGPT 및 GPT-4는 사용자의 대화 내역 데이터를 수집해 기업의 보안 문제를 야기할 수 있고 또한 생성된 결과물의 환각 문제로 인한 기업 문서의 신뢰성 저하를 초래할 수 있다. 특히 LLM 생성 글은 인간의 글과 유사한 수준으로 유창성을 확보한만큼 산업현장에서 LLM 작성 글이 판별되지 못할 경우 기업 활동에 큰 제약을 줄 수 있다. 그러나 현재 한국어 LLM 작성 글 탐지 서비스가 전무한 실정이다. 본 논문에서는 한국어 초거대언어모델 작성 글 판별기: KoCheckGPT 를 제안한다.KoCheckGPT는 산업현장에서 자주 사용되는 문어체, 개조식 글쓰기로 작성된 문서 도메인을 목표로 하여 글 전체와 문장 단위의 판별 정보를 결합하여 주어진 문서의 LLM 작성 여부를 효과적으로 판별한다. 다국어 LLM 작성 글 판별기 ZeroGPT와의 비교 실험 결과 KoCheckGPT는 우수한 한국어 LLM 작성 글 탐지 성능을 보였다.

  • PDF

읽기 매체의 다양성과 흥미도를 고려한 가독성 측정 (Revisiting Readability: An aspect of the reading environments and perspectives)

  • 김아영;박성배;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.59-63
    • /
    • 2013
  • 가독성이란 글을 읽음에 있어 얼마나 쉽게 쓰여졌는가, 얼마나 흥미로운가의 정도를 나타낸다. 기존 연구에서는 가독성을 측정함에 있어 인쇄물에 한정하고 글의 구성 관점에서만을 반영하였다. 하지만, 글은 인쇄물뿐만 아니라 모바일, 태블릿 등 다양한 읽기 매체를 통해 읽어질 수 있으며 글의 흥미에 따라 가독성이 달라지므로 기존의 연구 방법으로는 적절히 반영할 수 없다. 본 논문에서는 읽기 매체에 따라 가독성이 어떻게 달라지는지, 가독성을 측정함에 있어 관점들이 어떻게 반영되는지를 살펴보고자 한다. 서로 다른 읽기 매체들을 사용하여 동일한 뉴스 기사에 대해 가독성을 측정하였으며, 측정된 결과를 사용하여 각 읽기 매체가 가독성를 측정하는 요소들 중 어떤 요소에 큰 영향을 받는지를 살펴본다. 또한, 가독성을 측정함에 있어 글의 구성뿐만 아니라 흥미 관점을 추가하였으며, 이로부터 가독성의 요소들이 글의 구성 관점과 흥미 관점에서 어떠한 차이점을 보이는지 살펴본다.

  • PDF

온라인 커뮤니티상에 나타난 여성혐오 현상 분석 (Analyzing the phenomenon of misogyny in online community)

  • 이지현;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.27-28
    • /
    • 2019
  • 본 논문에서는 한국 사회에 특유의 폭력성과 선정성으로 인해 큰 충격을 주고 있는 인터넷 커뮤니티 사이트 '일간 베스트' 글에 나타난 욕설과 여성 혐오에 대해 분석하고자 한다. 데이터는 일베 게시판에 올라온 게시글 2,000개를 웹 크롤링하여 수집하였으며, 수집한 게시글에 게임 내 금칙어 리스트와 여성 지칭어 사전을 기반으로 욕설 여부와 여성 지칭어를 태깅하였다. 태깅하여 분석한 결과 여성 지칭어를 사용한 게시글에는 욕설을 사용하는 글이 전체의 60.52%로 많았으며 욕설을 사용하지 않은 게시글에도 범행, 살해, 김치녀 등의 부정적인 단어가 많은 것을 볼 수 있었다.

  • PDF

Glycine betaine의 급여가 돈육의 품질에 미치는 영향 (Effect of Dietary Glycine Betaine on Pork Qualities During Storage)

  • 박구부;허선진;양한슬;이정일;곽석준;이중동;허남응;김진성;주선태
    • Journal of Animal Science and Technology
    • /
    • 제46권5호
    • /
    • pp.821-832
    • /
    • 2004
  • 80두의 3원교잡종 돼지를 이용하여, 40일간 글라이신 베타인이 함유된 시험사료를 급여한 후 도축하여 글라이신 베타인 급여가 돈육 등심의 품질에 미치는 효과를 측정하였다. 돈육 등심내 글라이신 베타인의 축적율은 글라이신 베타인의 급여량이 높을수록 높게 나타났다(P<0.05). 0.4% 글라이신 베타인 급여구는 저장기간의 증가에 따라 등심육의 pH가 유의적으로 (P<0.05) 증가하였으며, 저장 13일에는 글라이신 베타인 급여구가 대조구에 비교해 유의적으로(P<0.05) 높은 pH를 나타내었다. 글라이신 베타인 급여 수준에 의한 명도값$(L^*)$은 유의적인 차이를 나타내지 않았으며, 적색도$(a^*)$ 또한 글라이신 베타인의 급여에 의한 주목할만한 경향을 나타내지 않았다. 황색도 $b^*$는 저장 9일에 0.4%와 0.6% 글라이신 베타인 급여구가 대조구와 0.2% 글라이신 베타인 급여구에 비교해 유의적으로 (P<0.05) 낮게 냐타났다. 또한 저장 13일에는 0.6% 급여구가 가장 낮은(P<0.05) 황색도 값을 나타내었다. 글라이신 베타인 급여에 의한 전단력 차이에서는 글라이신 베타언급여구가 대조구에 비교해 유의적으로(P<0.05) 높은 전단가를 나타내었다. 또한 저장 9일까지는 0.4% 글라이신 베타인 급여구가 가장 높은(P<0.05) 전단력을 나타내었으며, 저장 13일에는 0.2% 글라이신 베타인 급여구가 유의적으로(P<0.05) 가장 높은 전단력을 나타내었다. 근절의 길이의 변화를 보면 0.6% 글라이신 베타인 급여구가 전 저장기간동안 기장 짧은(P<0.05) 근절길이를 냐타내었으며, 대조구의 근절길이는 전 저장기간동안 가장 길게 나타났다. 지방산패도의 변화는 저장기간이 경과할수록 모든 처리구의 지방산패도는 유의적으로(P<0.05) 증가하였으나, 처리구간의 지방산패도는 전 저장기간동안 유의적인 차이를 나타내지 않았다. 글라이신 베타인의 급여에 의해 불포화지방산의 함량은 감소하고 포화지방산의 함량은 증가하는 결과를 나타내었다. 특히 linoleic acid와 myristic acid는 글라이신 베타인의 급여수준이 높을수록 감소하는(P<0.05) 경향을 나타내었다. 신선육의 관능검사에서 육색은 저장 1일차에 글라이신 베타인 급여구가 대조구에 비교해 유의적으로(P<0.05) 높게 나타났으나 저장기간이 경과한 이후에는 처리구간의 육색은 차이가 나타나지 않았다. 그러나 신선육 육향과 전체적언 가호도 및 가열육 관능검사는 처려구간의 주목할만한 차이를 나타내지 않았다.

온라인 게시글의 조회수 분석을 통한 인기도 예측 (Prediction Model for Popularity of Online Articles based on Analysis of Hit Count)

  • 김수도;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제12권4호
    • /
    • pp.40-51
    • /
    • 2012
  • 한국의 온라인 토론게시판은 의견 공유뿐 아니라 여론 형성과 참여를 위한 공간으로 활발히 사용되고 있다. 토론게시판에서 어떤 글은 사회적 정치적 이슈를 몰고 다니기도 하고 어떤 글은 사용자의 관심을 끌지 못하기도 한다. 본 논문에서는 한국의 유명 토론게시판인 다음 아고라와 서프라이즈에서 수집한 글의 통계적 정보를 이용하여 글의 인기를 분석하고 인기글을 예측하기 위한 예측모델을 제안한다. 분석결과 아고라는 87.52%의 글이 게시판에 제출된 후 하루가 지나기 전에 글의 인기가 끝나고 있었지만 서프라이즈는 39%의 글이 4일 이상 인기가 지속되고 있었다. 그렇지만 글의 인기기간과 조회수의 상관관계는 낮았다. 조회수 증가가 오랫동안 지속된다고 해서 최종 조회수가 높다는 것을 의미하지는 않는다. 본 논문에서는 분류와 예측 분야에서 잘 알려진 SVM 모델과 유사매칭 모델, 그리고 새롭게 제안한 예측 모델 '베이스 라인'을 이용하여 인기글을 예측하고 평가하였다. SVM 모델이 F-measure와 정밀도에서 유사매칭과 베이스라인보다 우수하였으며, 베이스라인이 실행시간에서 가장 우수한 성능을 보였다.