• 제목/요약/키워드: 연관단어

검색결과 252건 처리시간 0.023초

연관속성개념공간으로의 사상을 이용한 단백질 상호작용 예측 (Prediction of Protein Interactions using the Associative Feature Concept Space Mapping)

  • 엄재홍;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.73-75
    • /
    • 2006
  • 생물체 내에서 중요 생물학적 기능을 수행하는 기본 단위인 단백질 및 이들의 상호작용 대한 많은 연구가 이루어져 다양한 생물체에 대한 단백질 상호작용 데이터베이스가 구축되었다. 본 논문에서는 효모에 대해 공개되어있는 단백질 상호작용 데이터를 이용하여 새로운 단백질 상호작용을 예측하는 방법을 제안한다. 논문에서는 문헌에서 연관 정보를 효율적으로 찾아내기 위하여 제안된 연관개념공간 탐색 방법을 확장하여 단백질 상호작용 예측에 사용한다. 단백질들은 각각이 가지는 다양한 속성들의 벡터로 간주되며, 상호작용은 해당 단백질들의 연관성을 통해 이루어지는 것으로 표현된다. 상호작용하는 두 단백질들의 속성은 단어의 공동 출현과 같이 고려되어 단백질 상호작용은 두 단백질 벡터의 요소로 표현되고 벡터의 요소 속성들 간의 연관성을 표현하기 위해 연관속성개념공간으로 사상되어 공간상의 거리 기반으로 연관속성을 추출한다. 추출된 연관속성을 최대로 포함하는 단백질들 간의 상호작용을 예측하는 방식으로 단백질 상호작용을 예측한다. 논문에서 제안한 방법은 효모의 단백질 상호작용 예측에 대해 평균 약 91.8%의 예측 정확도를 보여, 연관속성개념공간을 이용한 방법이 단백질 상호작용을 예측하는 또 다른 대안으로 사용 될 수 있음을 확인하였다.

  • PDF

시소러스를 이용한 문서 자동 요약 (Automatic Text Summarization Using Thesaurus)

  • 이창범;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.352-354
    • /
    • 2001
  • 문서 자동요약은 입력된 문서에 대해 컴퓨터가 자동으로 요약을 생성하는 과정을 의미한다. 즉, 컴퓨터가 문서의 기본적인 내용을 유지하면서 문서의 복잡도 즉 문서의 길이를 줄이는 작업이다. 효율적인 정보 접근을 제공함과 동시에 정보 과적재를 해결하기 하기 위한 하나의 방법으로 문서 자동요약에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 의미기반 정보검색용 시소러스(thesaurus)를 이용한 문서 자동요약을 제안한다. 제안한 방법에서는 단어간의 연관 관계 즉, 동의어, 유의어, 상위어, 하위어 관계를 문서 요약에 이용한다. 크게 연관 사슬 형성 단계, 중심 문장 추출 단계, 요약 생성 단계의 새단계로 나누어 요약을 생성한다. 수동 요약된 신문기사를 대상으로 평가한 결과 평균 66%가 일치하였다.

  • PDF

사회적 관계가 개인의 정보처리와 정서경험에 미치는 효과 (Impact of social relationships on self-related information processing and emotional experiences)

  • 신홍임;김주영
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제24권1호
    • /
    • pp.29-47
    • /
    • 2018
  • 사회적 상황은 개인의 정보처리와 정서경험에 영향을 주는가? 본 논문에서는 두 개의 연구를 통해 사회적 정보처리와 자기참조효과 및 정서경험의 관계를 검증하였다. 연구 1에서는 외부의 명시적 지시없이도 자기개념이 자동적으로 활성화되어, 도형과제를 통해 자신과 연관된 자극의 처리가 친구/타인과 연관된 자극의 처리보다 더 수월한지를 검증했다. 그 결과 자신을 표상하는 자극의 처리가 친구/타인에 대한 자극처리보다 더 촉진되는 경향이 나타났다. 연구 2에서는 참가자들에게 다양한 단어를 보여주고, 자신이 선택한 단어 또는 친구가 선택한 단어라는 설명과 함께 제시된 단어에 대한 기억을 비교하였다. 그 결과 참가자들은 혼자 과제를 수행하는 비사회적 조건에서 친구와 함께 과제를 수행하는 사회적 조건보다 자신이 선택한 단어를 더 많이 기억하는 경향이 나타났다. 이에 비해 사회적 조건에서는 참가자들이 친구가 선택한 단어를 자신이 선택한 단어보다 더 많이 기억하였다. 또한 사회적 조건에서는 실험상황에서 초콜릿 경험에 대해 보고한 긍정적 정서의 강도가 비사회적 조건보다 더 높게 나타났다. 이 결과는 사회적 정보처리가 자동적 자기참조효과를 감소시키며, 타인과의 경험공유는 정서경험을 증폭시킬 가능성을 시사한다.

워드 임베딩과 유의어를 활용한 단어 의미 범주 할당 (Assignment Semantic Category of a Word using Word Embedding and Synonyms)

  • 박다솔;차정원
    • 정보과학회 논문지
    • /
    • 제44권9호
    • /
    • pp.946-953
    • /
    • 2017
  • 의미역 결정은 서술어와 논항들 사이의 의미 관계를 결정하는 문제이다. 의미역 결정을 위해 의미 논항 역할 정보와 의미 범주 정보를 사용해야 한다. 세종 전자사전은 의미역을 결정하는데 사용한 격틀 정보가 포함되어 있다. 본 논문에서는 워드 임베딩과 유의어를 활용하여 세종 전자사전을 확장하는 방법을 제시한다. 연관 단어가 유사한 벡터 표현을 갖도록 하기 위해 유의어 사전의 정보를 사용하여 재구성된 벡터를 생성한다. 기존의 워드 임베딩과 재구성된 벡터를 사용하여 동일한 실험을 진행한다. 워드 임베딩을 이용한 벡터로 단어의 세종 전자사전에 나타나지 않은 단어에 대해 의미 범주 할당의 시스템 성능은 32.19%이고, 확장한 의미 범주 할당의 시스템 성능은 51.14%이다. 재구성된 벡터를 이용한 단어의 세종 전자사전에 나타나지 않은 단어에 대해 의미 범주 할당의 시스템 성능은 33.33%이고, 확장한 의미 범주 할당의 시스템 성능은 53.88%이다. 의미 범주가 할당되지 않은 새로운 단어에 대해서 논문에서 제안한 방법으로 의미 범주를 할당하여 세종 전자사전의 의미 범주 단어 확장에 대해 도움이 됨을 증명하였다.

단어연상검사법을 이용한 탐색 시소러스 구축에 관한 실험적 연구 (Searching Thesaurus Construction with Word Association Test: A Pilot Study)

  • 한승희
    • 한국문헌정보학회지
    • /
    • 제40권3호
    • /
    • pp.289-304
    • /
    • 2006
  • 본 연구에서는 단어의 의미연상을 이용하여 시소러스를 구축하고. 이 시소러스에 대해 탐색 시소러스로서의 기능성을 확인하기 위해 질의확장 실험을 수행하였다 연상 시소러스 구축을 위해 문헌정보학 분야를 대상으로 단어연상검사를 실시한 후 자극어와 반응어간의 의미관계를 파악하고 반응어와 기존 시소러스의 디스크립터를 비교 분석하였다. 실험 및 분석결과. 단어연상검사를 이용하여 시소러스를 구축하면 기존의 시소러스에 비해 연관관계 용어들을 시소러스에 다양하게 반영할 수 있으며, 통제어휘집에 나타난 하위관계와 동등관계 용어들을 어느 정도 반영할 수 있다는 것을 확인하였다. 또한 질의확장 실험결과 단어연상 시소러스가 기존 시소러스에 비해 비교적 우수한 성능을 보여 단어연상 시소러스가 정보검색환경에서 질의 확장에 응용될 수 있음을 증명하였다.

퍼지추론과 코호넨 신경망을 사용한 유즈넷 뉴스 필터링 (Usenet News Filtering using Fuzzy Inference and Kohonen Network)

  • 김종완;조규철;김병익
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2003년도 춘계학술대회
    • /
    • pp.47-51
    • /
    • 2003
  • 인터넷을 통해 제공되는 맡은 양의 뉴스 정보 중에서 찾고자 하는 정확한 정보를 빠른 시간 안에 검색하고, 원하는 정보만 필터링 하는 것이 필요하다. 먼저, 인터넷에 접속된 뉴스서버들의 뉴스 문서를 각 그룹별로 수집한다. 수집된 뉴스 문서를 대상으로 퍼지추론을 통하여 문서를 대표하는 키워드를 추출하여 데이터베이스에 저장한다. 각 뉴스그룹의 문서에서 단어들을 분석하여 입력된 단어들의 개수를 이용하여 정규화 시켜서 대표적인 비지도학습 신경망인 코호넨 신경망을 사용하여 학습시킨다. 코호넨 신경망으로 추출된 단어들의 연관성을 활용하여 뉴스그룹을 클러스터링한다. 최종적으로 사용자가 관심 있는 키워드를 입력하면, 학습된 신경망이 유사한 뉴스그룹들을 사용자에게 제시해준다.

  • PDF

언어기반 게임그래픽 디자인 발상의 창의적 인지에 관한 연구 (A Study on Creative Cognition of Language based concept Generation of Game Graphics)

  • 허윤정
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.171-179
    • /
    • 2011
  • 본 연구는 디자인발상 과정에서 구글의 연관 검색어를 언어 자극으로 제공했을 경우 디자인 결과에 어떠한 결과를 주는지 그리고 그러한 과정에서 창의적 인지 과정이 어떻게 사용되는 지를 분석하였다. 디자인 발상 과정에 구글의 연관 검색어를 자극제로 5단계에 걸쳐 제공하였다. 구글 검색어는 다수의 사용자의 참여와 공헌에 의해 새롭게 재창조된 지식과 정보를 제공하는 집단지성에 기반을 두고 있다. 실험을 위해 두 가지 과제를 연관 검색어들과 함께 제공하였다. 디자인 발상실험 후 연관검색어의 사용여부와 빈도수 그리고 핀케의 12가지 제네플로어 모델이라는 3가지 기준에 의해 분석하였다. 본 연구의 결과를 요약하면 다음과 같다. 여러 단계의 연관 검색어들을 사용했으나, 초기 연관 검색어와 연관성이 높은 상위 단계의 검색어가 하위 단계의 검색어보다 더 많이 사용되었다. 또한 상위 단계와 하위 단계의 검색어들을 함께 사용했을 때 더 창의적의 결과가 나타났다. 핀케의 제네플로어 모델의 12가지 인지 과정에 따라 실험결과물을 분석한 결과 창의적 결과물은 단순히 연관 검색어를 사용하기 보다는 여러 단어들을 연합하고 변형하였으며 또한 창의적인 결과에는 12가지 인지 과정 중 개념적 해석, 기능적 추론과 맥락적 전이와 같은 인지 과정이 사용되었다.

소셜 네트워크 빅데이터 분석을 통한 마라톤 대중화 : JTBC 마라톤대회를 중심으로 (Popularization of Marathon through Social Network Big Data Analysis : Focusing on JTBC Marathon)

  • 이지수;김지영
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권3호
    • /
    • pp.27-40
    • /
    • 2020
  • 마라톤은 남녀노소 누구나 즐길 수 있는 대표적인 생활체육으로 자리 잡은 지 오래이다. 최근 삶의 균형을 뜻하는 워라밸(Work and Life Balance) 트렌드가 전 사회로 확대되면서 진입 장벽이 비교적 낮은 마라톤은 20-30대 젊은 층에게 인기를 끌고 있다. 마라톤 대회의 이슈와 연관단어를 분석하여 2030 젊은 층들에게 인기 있는 마라톤 대회의 스포테인먼트적인 요소를 키워드를 통해 분석하여 차별화된 대회를 위한 발전방안을 제시하고자 한다. 키워드 및 연관단어 분석을 위해 네이버(Naver)와 다음(Daum)에서 제공하는 블로그, 카페, 뉴스가 분석채널로 선정되었고, 빅데이터 자료 검색을 위한 키워드는 'JTBC마라톤'과 '문화'를 주제어로 추출하였다. 자료 분석 기간은 2019년 JTBC 마라톤대회 참가 신청이 시작된 2019년 8월 13일부터 2019년 11월 13일까지 3개월간의 기간으로 한정하였다. 자료수집 및 분석을 위하여 소셜 매트릭스 프로그램인 텍스톰(Textom)을 통해 빈도 및 매트릭스 데이터를 추출하였다. 또한 텍스톰을 활용하여 단어들 간의 연결 구조와 연결정도 중심성을 분석하여 관계의 정도를 계량화 하였다. 분석결과를 살펴보면 첫째, 마라톤은 개인 운동임에도 불구하고 젊은 층들은 '러닝'이라는 공통분모를 공유하며 다른 젊은 층들과 '러닝크루'라는 새로운 문화 집단을 형성하였다. 이를 통해 홀로 외로이 뛰며 자신과의 싸움을 벌이는 마라톤의 이미지에서 벗어나 같이 훈련하고 같이 참가하며 같이 즐기는 축제의 장으로써의 마라톤 대회문화가 형성된 것을 확인할 수 있었다. 둘째, '훈련'의 과정을 중시하고 이를 다른 이들과 SNS를 통해 공유하는 문화가 확산되었음을 알 수 있었다. 세 번째, 유명인과 관련된 단어가 다양하게 도출되었다. 이는 마라톤대회에 참가하여 함께 레이스를 펼친 유명인은 물론 대회가 끝난 후 '애프터공연'에 출연하는 연예인에 대한 참가자들의 높은 관심을 반영한 결과라 하겠다. 네 번째, '후기'와 관련된 단어가 빈번히 도출되었다. 이는 젊은 마라토너들이 마라톤 준비과정은 물론 대회 당일의 경험을 타인들과 공유하는 문화가 반영된 것이라 분석된다. 다섯 번째, 공연과 관련된 단어가 상위 순위에서 도출되었다. 여섯 번째, '도전', '멋진', '성공', '즐겁' 등 긍정적이고 진취적인 감정을 표현하는 단어가 다수 도출되었다. 이 연구의 결과를 통해 젊은 아마추어 마라토너들의 마라톤대회 참가 동기와 목적은 건강과 체력증진처럼 단일하거나 단편적이지 않으며 다양하고 복합적인 종합 문화체험 행사로 마라톤 대회에 참가하고 있음을 확인할 수 있었다. 결국, 젊은 마라토너들의 마라톤 참여는 참가자체에 목적을 두는 '체력증진'의 목적보다는 대회를 선정하고 대회를 크루멤버들과 함께 준비하고 대회를 끝맺음하기까지의 일련의 과정을 하나의 '축제'로 여기는 것을 엿볼 수 있었다.

빈발단어집합을 이용한 NaiveBayes의 정확도 개선 (An Improvement of Accuracy for NaiveBayes by Using Large Word Sets)

  • 이재문
    • 인터넷정보학회논문지
    • /
    • 제7권3호
    • /
    • pp.169-178
    • /
    • 2006
  • 본 논문은 연관규칙탐사 기술에서 사용되는 빈발항목집합을 변형하여 문서분류의 문서에서 빈발단어집합을 정의하고, 이를 사용하여 문서분류 방법으로 잘 알려진 NaiveBayes에 적용하여 이 방법의 정확도를 개선한다. 이 기술의 적용을 위하여 하나의 문서는 여러 개의 문단으로 나뉘어졌으며, 각 문단에 나타나는 단어들의 집합을 트랜잭션화하여 빈발단어 집합을 찾을 수 있도록 하였다. 제안한 방법은 Al::Categorizer 프레임워크에서 구현되었으며 로이터-21578 데이터를 사용하여 그 정확도가 측정되었다. 문단에서의 라인수와 학습문서의 크기를 변화하면서 정확도를 측정하였다. 측정된 결과로부터 제안된 방법이 기존의 방법에 비하여 정확도를 개선한다는 사실을 알 수 있었다.

  • PDF

문단 분석을 통한 문서 내의 감정 예측 (Emotion Prediction of Document using Paragraph Analysis)

  • 김진수
    • 디지털융복합연구
    • /
    • 제12권12호
    • /
    • pp.249-255
    • /
    • 2014
  • 최근 트위터, 페이스북 등과 같은 소셜 네트워크 서비스(Social Network Service, SNS)의 확산과 더불어 정보의 생성 및 공유가 활발히 이루어지고 있다. 이러한 SNS 매체들을 통해 생산하는 많은 데이터를 활용하기 위해 축적된 데이터로부터 의미 있는 정보를 추출해 내는 기술의 필요성이 대두되고 있으며, 데이터 마이닝 기법을 이용하여 의미있는 지식을 찾아낸다. 특히, 다양한 형태의 방대한 자료들로부터 표출되는 의견, 정책, 성향, 감정 등 대중의 집단지성에 나타난 일반적인 감정분석이 활용되고 있다. 본 논문에서는 대중들이 SNS를 통해 작성한 사용자들의 짧은 문장에 함축된 단어와 단어들 간의 연관성을 이용하여 문장 내 감정 상태를 예측하고 사용자의 감정에 따른 적절한 답변이나 추출한 감정과 유사한 트윗글이나 영화 등을 추천하는데 사용될 수 있는 방법을 제안한다.