• Title/Summary/Keyword: 연관어

Search Result 370, Processing Time 0.039 seconds

A Method for Detecting Event-location using Relevant Words Clustering in Tweet (트위터에서의 연관어 군집화를 이용한 이벤트 지역 탐지 기법)

  • Ha, Hyunsoo;Woo, Seungmin;Yim, Junyeob;Hwang, Byung-Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.680-682
    • /
    • 2015
  • 최근 스마트폰의 보급으로 소셜 네트워크 서비스를 이용하는 사용자들이 급증하였다. 그 중 트위터는 정보의 빠른 전파력과 확산성으로 인해 현실에서 발생한 이벤트를 탐지하는 도구로 활용하는 것이 가능하다. 따라서 트위터 사용자 개개인을 하나의 센서로 가정하고 그들이 작성한 트윗 텍스트를 분석한다면 이벤트 탐지의 도구로써 활용할 수 있다. 이와 관련된 연구들은 이벤트 발생 위치를 추적하기 위해 GPS좌표를 이용하지만 트위터 사용자들이 위치정보 공개에 회의적인 점을 감안하면 명확한 한계점으로 제시될 수 있다. 이에 본 논문에서는 트위터에서 제공하는 위치정보를 이용하지 않고, 트윗 텍스트에서 위치정보를 추적하는 방법을 제시하였다. 트윗 텍스트에서 키워드간의 관계를 고려하여 이벤트의 사실여부를 결정하였으며, 실험을 통해 기존 매체들보다 빠른 탐지를 보임으로써 제안된 시스템의 필요성을 보였다.

A WordNet-based Feature Merge Method for HyperText Classification (하이퍼텍스트 문서의 자동분류를 위한 워드넷 기반 특징 합병 기법)

  • Roh, Jun-Ho;Kim, Han-Joon;Chang, Jae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.406-409
    • /
    • 2012
  • 본 논문은 하이퍼텍스트 문서의 자동분류 성능을 높이기 위한 새로운 접근법을 제시한다. 하이퍼텍스트 문서는 일반 문서와 달리 하이퍼링크로 서로 연결된 구조를 가진다. 이 하이퍼링크 정보는 대상문서와 연관도가 높은 정보를 가지고 있으며, 이러한 링크 정보로부터 특징을 보다 잘 선별하기 위해서는 보다 정밀한 접근법이 필요하다. 본 논문은 단어간 의미 유사도를 기반으로 하이퍼텍스트 링크 정보를 활용한 특징 가공기법을 제안한다. 제안 기법은 하이퍼링크 문서로부터 대상문서와 연관도가 높은 특징을 추출하기 위해 단어간 유사도 함수를 사용하며, 유사도 함수는 워드넷의 상/하위어 관계를 이용한다. 그리고 추출된 특징들 중 의미적으로 비슷한 개념의 특징들을 합병함으로써 의미적으로 보다 견고한 분류 모델을 구축한다. 제안 기법을 검증하기 위해 Web-KB 문서집합을 이용하여 실험을 수행하였고 실험 결과 기존 방법보다 우수한 성능을 보였다.

Issue summarization scheme based on real-time SNS trend analysis (실시간 SNS 트렌드 분석에 기반한 이슈 요약 기법)

  • Kim, Daeyong;Kim, Daehoon;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1096-1097
    • /
    • 2013
  • 최근 Twitter를 비롯한 소셜 네트워크 서비스의 급속한 확산으로 인해, 많은 수의 SNS 메시지가 실시간으로 생성되고 있다. 이러한 SNS 상의 모든 글을 읽어보는 것은 현실적으로 불가능하며, 여러 포탈 사이트에서 제공되는 실시간 검색어 순위만으로는 상세 내용을 직관적으로 파악하기 어렵다. 따라서, 이러한 SNS상의 글을 실시간으로 분석하여 최신의 트렌드를 찾고 이와 연관된 내용을 분류 및 요약할 수 있다면, 사용자에게 유용한 최신 정보를 생성하여 제공할 수 있다. 본 논문에서는 Tweet 들을 분석하여 얻은 트렌드 키워드를 기반으로 관련된 Tweet 들을 주제 별로 분류한 후, 각 주제 별로 세부 내용을 요약해서 제공하는 기법을 제안한다. 제안하는 기법은 실시간으로 생성되는 Tweet 내에서 최근 화제가 된 트렌드 및 연관 키워드를 추출해낸다. 그 후, 해당 키워드가 출현한 Tweet 내에서 핵심 키워드를 찾고, 이를 기반으로 Tweet 들을 각각의 주제별로 분류하고 각 주제를 '이슈'로 정의한다. 마지막으로, 특정한 이슈에 해당되는 Tweet들을 분석하여 각 이슈 별로 키워드 리스트 및 단문 형식으로 요약된 줄거리를 생성한다. 제안된 기법을 바탕으로 프로토타입 시스템을 구현하고, 다양한 실험을 통하여 이슈 검출 기법의 유용성 면에서 성능을 평가한다.

A study on the Change of Perception of Public Health before and after COVID-19 (COVID-19 발생 전·후 공공의료에 대한 인식변화)

  • Kim, Yu Jeong;Lee, Dong Su
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.367-370
    • /
    • 2022
  • 본 연구는 코로나19 발생 전·후 공공의료를 둘러싼 사회적 인식변화를 뉴스빅데이터를 통해 파악하고자 시도되었다. 뉴스빅데이터는 코로나19 확진자가 처음 발생한 2020년 1월을 기준으로 나누었으며, 코로나19 발생 이전(2018년 1월~2019년 12월, 총 24개월) 40,834건과 코로나19가 발병 이후(2020년 1월~2021년 12월, 총 21개월) 61,761건이었다. 수집된 빅데이터는 R 4.1.1 for Windows를 활용하여 단어 빈도 분석, 연관규칙분석을 실시하였다. 연구결과, 코로나19 발생 전후 뉴스기사에서 공공의료를 둘러싼 핵심어를 비교할 때 코로나19 발생 후에 발생 전보다 큰 폭으로 상승한 단어는 '확산'(664%), '대응'(658%), '의사'(518%), '상황'(504%), '공공병원'(486%), '의료진'(455%), '확충'(324%), '인력'(305%), '어려움'(272%), '정부'(247%)순으로 나타났다. 코로나19 발생 전후 공공의료를 둘러싼 키워드의 연관규칙 분석을 통해서 의료의 패러다임이 일자리 산업에서 감염증 대응을 위한 보건의료로 전환되는 것을 알수 있었다.

  • PDF

Cancer Research Trends in Traditional Korean Medical Journals since 2000 - Topic Modeling Using Latent Dirichlet Allocation and Keyword Network Analysis (2000년 이후 국내 한의학 암 관련 연구 동향 분석 - Latent Dirichlet Allocation 기반 토픽 모델링 및 연관어 네트워크 분석)

  • Kyeore Bae
    • The Journal of Internal Korean Medicine
    • /
    • v.43 no.6
    • /
    • pp.1075-1088
    • /
    • 2022
  • Objectives: The aim of this study is to analyze cancer research trends in traditional Korean medical journals indexed in the Korea Citation Index since 2000. Methods: Cancer research papers published in traditional Korean medical journals were searched in databases from inception to October 2022. The numbers of publications by journal and by year were descriptively assessed. After natural language processing, topic modeling (based on Latent Dirichlet allocation) and keyword network analysis were conducted. Results: This research trend analysis involved 1,265 papers. Six topics were identified by topic modeling: case reports on symptom management, literature reviews, experiments on apoptosis, herbal extract treatments of breast carcinoma cell lines, anti-proliferative effects of herbal extracts, and anti-tumor effects. Keyword network analysis found that the effects of herbal medicine were assessed in clinical and experimental studies, while acupuncture was mainly mentioned in clinical reports. Conclusions: Cancer research papers in traditional Korean medical journals have contributed to evidence-based medicine. Further experimental studies are needed to elucidate the effects of on different hallmarks of cancer. Rigorous clinical studies are needed to support clinical guidelines.

A Comparative Study of Local Newspapers' News Frame: Focus on Nuclear Waste Site Reporting (지역신문 뉴스 프레임 비교: 핵폐기장 관련 보도를 중심으로)

  • Choi, Nak-Jin
    • Korean journal of communication and information
    • /
    • v.27
    • /
    • pp.283-316
    • /
    • 2004
  • This study examines different news frames of local newspapers reporting the controversial 'Nu[lear Waste Site' issues which deeply split regions showing their intention to bid for the state affair. Three local papers were analyzed for this study, "Gwang-Ju-Il-bo" "Mae-il-sin-mun" and "Jun-buk-il-bo." Overall, the three local papers displayed widely divergent main news frames on the same issue. Firstly, "Gwang-Ju-Il-bo", and "Mae-il-sln-mun" showed the strong tendency of using 'counter frame' while "Jun-buk-il-bo" exhibited 'loral development frame'. Secondly, "Gwang-Ju-Il-bo", and "Mae-il-sin-mun" were frequently headlined 'Nuclear Waste Site', while "Jun-buk-il-bo" carried headlines 'Radioactive Waste Management Facility' overwhelmingly more often than the other two papers, indicating that headline key words are closely associated with the configuration of news frames. Thirdly, the main news frames remained consistent for "Gwang-Ju-Il-bo", and "Mae-il-sin-mun" even after the government's report about the possible connection of 'ion-beam irradiation-accelator' and 'Nuclear Waste Site.' On the other hand, "Jun-buk-il-bo" was significantly less headlined 'Nuclear Waste Site' while significantly more headlined "Radioactice Waste Management Facility." "Jun-Buk-il-bo" which is in stark contrast to the other two papers changed in its tone by increasing the 'local development frame' with decrease in the 'counter frame.' The "Jun-buk-il-bo"'s more frequent use of 'Radioactive Waste Management Facility' as a headline than "Nuclear Waste Management Equipment" is seen as its attempt to minimize negative image of Nuclear Waste and to promote favorable public opinion by highlighting aspects of economic benefits and the local development the construction would brind about. The major findings of this study further support the claim that media overage ends up a reality. The fact that Buan in Jun-buk Province made a successful bid for the construction is not a coincidence.

  • PDF

A Comparative Study on Joy in Russian and Korean (기쁨의 의미연구 - 러시아어와 한국어의 비교를 중심으로 -)

  • Kim, Jung-Il
    • Cross-Cultural Studies
    • /
    • v.41
    • /
    • pp.113-140
    • /
    • 2015
  • This paper explains how the basic and instinctive emotion "joy" is verbally expressed in Russian and Korean. In particular, the main concern of this pater is on the cultural context with which the emotion "joy" is related and the ways in which the emotion "joy" has a wide range of uses. The semantic and pragmatic characteristics of the uses of the expression "joy" can be explained through the cultural and historical backgrounds in both languages. In Russian, joy has two variants, radost' and udovol'stvie. It is very difficult to distinguish a significant difference between them; however, the former is mainly connected with more mental, spiritual, cultural, and religious contexts, whereas the latter is mainly related with more concrete, instantaneous contexts and daily life. The former produces an impression that has a more wide, spiritual, and macroscopic attitude toward a situation, whereas the latter produces an impression that has a microscopic and instantaneous attitude toward a situation. Compared with the Russian expressions, the Korean equivalents, 기쁨 and 즐거움, have a very similar opposition like that of the Russian. The former is based on a more logical and causal relation between an anticipation or desire and the current situations, whereas the latter is based on the participation of speakers in a situation and has a very instantaneous characteristic, like a udovol'stvie in Russian. Thus, it can be reasonable argued that the Russian udovol'stvie and the Korean 즐거움 share many similar semantic properties. In brief summary, in both languages there exists two distinctive variants that show a privative opposition to express the emotional concept of joy.

Derivation of Green Infrastructure Planning Factors for Reducing Particulate Matter - Using Text Mining - (미세먼지 저감을 위한 그린인프라 계획요소 도출 - 텍스트 마이닝을 활용하여 -)

  • Seok, Youngsun;Song, Kihwan;Han, Hyojoo;Lee, Junga
    • Journal of the Korean Institute of Landscape Architecture
    • /
    • v.49 no.5
    • /
    • pp.79-96
    • /
    • 2021
  • Green infrastructure planning represents landscape planning measures to reduce particulate matter. This study aimed to derive factors that may be used in planning green infrastructure for particulate matter reduction using text mining techniques. A range of analyses were carried out by focusing on keywords such as 'particulate matter reduction plan' and 'green infrastructure planning elements'. The analyses included Term Frequency-Inverse Document Frequency (TF-IDF) analysis, centrality analysis, related word analysis, and topic modeling analysis. These analyses were carried out via text mining by collecting information on previous related research, policy reports, and laws. Initially, TF-IDF analysis results were used to classify major keywords relating to particulate matter and green infrastructure into three groups: (1) environmental issues (e.g., particulate matter, environment, carbon, and atmosphere), target spaces (e.g., urban, park, and local green space), and application methods (e.g., analysis, planning, evaluation, development, ecological aspect, policy management, technology, and resilience). Second, the centrality analysis results were found to be similar to those of TF-IDF; it was confirmed that the central connectors to the major keywords were 'Green New Deal' and 'Vacant land'. The results from the analysis of related words verified that planning green infrastructure for particulate matter reduction required planning forests and ventilation corridors. Additionally, moisture must be considered for microclimate control. It was also confirmed that utilizing vacant space, establishing mixed forests, introducing particulate matter reduction technology, and understanding the system may be important for the effective planning of green infrastructure. Topic analysis was used to classify the planning elements of green infrastructure based on ecological, technological, and social functions. The planning elements of ecological function were classified into morphological (e.g., urban forest, green space, wall greening) and functional aspects (e.g., climate control, carbon storage and absorption, provision of habitats, and biodiversity for wildlife). The planning elements of technical function were classified into various themes, including the disaster prevention functions of green infrastructure, buffer effects, stormwater management, water purification, and energy reduction. The planning elements of the social function were classified into themes such as community function, improving the health of users, and scenery improvement. These results suggest that green infrastructure planning for particulate matter reduction requires approaches related to key concepts, such as resilience and sustainability. In particular, there is a need to apply green infrastructure planning elements in order to reduce exposure to particulate matter.

A Study on the User Behavior Analysis Framework (사용자 행태 분석 프레임워크에 관한 연구 <홈 환경 내 사용자 행태 분석을 중심으로>)

  • Oh, Sung-Yong;Kim, Yun-Jung;Lee, Eun-Shin;Bae, Hong-Joo;Jung, Ji-Hong
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02b
    • /
    • pp.340-344
    • /
    • 2006
  • 홈 환경은 독립 환경에서 네트워크 환경으로 발전되고 있으며, 더 나아가 센서를 기초로 하는 컨텍스트 어웨어(context-aware) 환경으로 변화될 것이다. 이러한 홈 환경의 변화는 사용자에게 더 많은 요구와 니즈를 발생시키고, 이것을 만족시키기 위해서는 사용자의 관점에서 요구와 니즈를 파악하는 것이 필요하다. 본 연구에서는 '사용자의 행위는 사용자의 요구와 니즈를 표출한다' 와 '사용자의 행위는 홈 환경 컨텍스트를 판단한 사용자 컨텍스트에 의해 발생된다' 라는 두 가지 주장을 전제로 하여, 사용자 행위와 사용자 컨텍스트를 통해 사용자의 니즈를 파악할 수 있는 프레임워크를 제안하는 데 그 목적이 있다. 이러한 프레임워크는 사용자 정보를 체계적으로 분석할 수 있게 하여 디자인 과정에서 사용자의 니즈를 추출하는 효과적인 장치가 될 것이다. 이에 먼저, 사용자 행위의 특성을 파악하기 위해 '행위카드 기록법' 을 이용한 사용자 조사를 실시하여 분석을 위한 데이터를 수집하였고, 그 다음으로, 수집 된 데이터를 도널드 노만(D.A.Norman)의 행동 7 단계 모델과 5W1H를 근거로 분석하여 사용자의 행위는 바라보는 관점에 따라 다른 해석을 가진다는 것을 밝혀내었다. 마지막으로, 그 관점을 '행위간의 연관성', '사용자 컨텍스트 요소간의 연관성', '사용자 행위와 사용자 컨텍스트 요소 간의 연관성'의 세가지 프레임워크로 구성하여 디자인 또는 기획의 과정에서 사용자의 정보를 활용할 수 있는 활용방안과 함께 제안한다.

  • PDF

LSTM Model Design to Improve the Association of Keywords and Documents for Healthcare Services (의료서비스를 위한 키워드와 문서의 연관성 향상을 위한 LSTM모델 설계)

  • Kim, June-gyeom;Seo, Jin-beom;Cho, Young-bok
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.75-77
    • /
    • 2021
  • A variety of search engines are currently in use. The search engine supports the retrieval of data required by users through three stages: crawling, index generation, and output of search results based on meta-tag information. However, a large number of documents obtained by searching for keywords are often unrelated or scarce. Because of these problems, it takes time and effort to grasp the content from the search results and classify the accuracy. The index of search engines is updated periodically, but the criteria for weighted values and update periods are different from one search engine to another. Therefore, this paper uses the LSTM model, which extracts the relationship between keywords entered by the user and documents instead of the existing search engine, and improves the relationship between keywords and documents by entering keywords that the user wants to find.

  • PDF