• 제목/요약/키워드: 단어동시출현 분석

검색결과 115건 처리시간 0.027초

이용자 반응 기반 이미지 감정 접근점 확장에 관한 연구 (An Expansion of Affective Image Access Points Based on Users' Response on Image)

  • 정은경
    • 한국비블리아학회지
    • /
    • 제25권3호
    • /
    • pp.101-118
    • /
    • 2014
  • 컴퓨터 정보기술의 발전과 함께 감정 기반 컴퓨팅이 다양한 분야에 빠르게 발전하여 확산되고 있다. 감정 기반 컴퓨팅의 지속적인 발전을 위해서는 이미지와 같은 멀티미디어의 콘텐츠의 감정 기반 색인과 검색이 필수적이다. 그러나 감정과 같은 추상적 개념은 주관적이며 이미지의 하위 수준 속성에서 유추하는데 한계가 있기 때문에 감정 색인은 통상적으로 난제로 여겨진다. 본 연구는 감정 색인 개선을 위해서 이미지에 대하여 이용자가 느끼는 감정 반응을 활용하여 이미지를 감정으로 접근하는데 있어서 확장된 접근점을 제공하는 방안을 고찰하였다. 이를 위하여 유로피아나 DB에서 사랑, 행복, 분노, 공포, 슬픔의 5가지 기본 감정을 표현한 이미지 15건을 선정하여 20명의 연구 참여자에게 보여주고 용어를 수집하였다. 이용자의 이미지 반응에서 수집한 용어는 정련 후 총 399건의 고유한 용어로 나타났다. 고유한 399건의 용어는 전체 1,093회 출현하였으며, 동시출현단어분석을 수행하여 상위 출현한 용어 네트워크를 구현하였다. 동시출현단어분석 기반의 네트워크를 통해서 기본 감정 용어와 함께 빈번하게 출현하는 용어를 규명하였다. 이를 통해 기본 감정용어와 함께 확장되어 제시될 수 있는 용어는 형용사, 동작/행위 표현 등 다양하게 나타났다.

연구영역분석을 위한 디스크립터 프로파일링에 관한 연구 (Descriptor Profiling for Research Domain Analysis)

  • 김판준;이재윤
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.285-303
    • /
    • 2007
  • 본 연구는 연구 영역 분석을 위하여 통제어휘와 비통제어휘를 연계해서 사용하는 새로운 방법을 모색하기 위한 것이다. 동시출현단어분석은 크게 통제어휘와 비통제어휘를 사용하는 경우의 두 가지 유형으로 구분할 수 있는데, 통제어휘를 사용할 경우에는 자료 희귀성 및 색인자 효과가 단점이며, 비통제어휘를 사용할 경우에는 저자의 주관에 따른 단어 선택 및 단어의 중의성이 문제가 된다. 이 연구에서는 양자를 보완할 수 있는 방법으로, 통제어휘인 디스크립터를 비통제어휘인 단어와의 동시출현 정보로 표현하는 디스크립터 프로파일링을 제안하였다. 정보학분야에 적용해본 결과, 디스크립터 프로파일링은 특정 영역의 최신 동향을 파악하는데 있어 통제어휘와 비통제어휘가 갖는 본질적인 문제점을 어느 정도 보완할 수 있는 것으로 나타났다.

텍스트마이닝과 동시출현단어분석을 이용한 한국, 중국, 일본의 우제목 연구 동향 분석 (The Tresnds of Artiodactyla Researches in Korea, China and Japan using Text-mining and Co-occurrence Analysis of Words)

  • 이병주;김백준;이제민;어수형
    • 한국환경생태학회지
    • /
    • 제33권1호
    • /
    • pp.9-15
    • /
    • 2019
  • 우제목은 짝수 개의 발굽을 갖는 포유동물로 다양한 종이 전 세계적으로 광범위하게 서식하고 있다. 최근 국내에서는 멧돼지, 고라니와 같은 야생 우제목 동물에 의한 농작물 피해, 로드킬 등의 급증과 산양, 사향노루 등 일부 종의 개체수 급감으로 사회적 관심을 받고 있다. 그러나 이러한 사회적 관심에도 불구하고 우제목 관련 국내 연구는 매우 부족하며, 국내 우제목의 연구 동향 분석도 이루어지지 않아 실질적인 문제점을 파악하는데 어려움이 있다. 최근 연구 동향분석에 있어 텍스트마이닝과 동시출현단어분석은 연구 문헌들에서 나타나는 주요 단어들을 추출하고 단어들 간의 연관성을 정량화하는데 활용되고 있으며, 연구 주제의 분류에 있어 객관성을 증가시킨다. 본 연구에서는 텍스트마이닝과 동시출현단어분석을 통해 한국, 중국, 일본 3국의 우제목 연구 논문을 분석하고 국가별 연구 주제를 비교하여, 국내 우제목 연구에서의 부족한 점과 향후 필요한 점을 알아보고자 하였다. 각 국가별로 우제목과 관련된 연구 논문을 검색하여 수집한 665편의 논문들에 대한 텍스트마이닝 결과, 총 199개 단어가 추출되었다. 추출된 단어들에 대한 동시출현단어분석 결과 3개의 단어군이 형성되었다. 각 단어군에 포함된 단어들을 살펴본 결과, 단어군1은 "서식환경/생태", 단어군2는 "질병", 단어군3은 "보전유전학/분자생태"와 관련 있는 것으로 판단된다. 국가별로 각 단어군의 비율을 살펴본 결과, 중국과 일본은 비교적 고른 단어군 비율을 나타낸 반면, 한국은 "질병"과 관련된 단어군2의 비율이 69%로 상당히 큰 편중을 나타내었다. 연도에 따른 각 단어군별 단어수 회귀 분석 결과에서도 중국과 일본은 3개의 단어군에 해당하는 단어수가 시간 경과에 따라 비교적 고르게 증가하였지만, 한국은 단어군2의 증가율이 나머지 단어군의 5배 이상을 나타냈다. 국내 우제목 연구는 중국과 일본에 비해 질병과 관련된 연구 위주로 진행된 것으로 판단되며, 서식 특성, 행동, 분자생태를 포함한 연구는 매우 적게 수행된 것으로 판단된다. 향후 국내 야생 우제목 동물에 의한 피해 조절과 멸종위기종 보호를 위한 합리적인 정책 수립을 위해, 야생 우제목에 대한 생태 연구를 집중적으로 실시하여 기초생태 자료를 축적시켜 나가야 할 것이다.

바이오인포매틱스 분야 회색문헌 및 백색문헌의 연구 동향 비교 분석 (Analyzing Research Trends in Bioinformatics based on Comparison between Grey and White Bioinformatics Literatures)

  • 김예은;김정주;송민
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.11-14
    • /
    • 2013
  • 본 연구의 목적은 바이오인포매틱스 분야의 회색문헌과 백색문헌의 초록을 대상으로 단어 동시출현(word co-occurrence)네트워크 분석을 통해 해당 분야의 연구 동향을 비교 분석하고자 하였다. 이를 위해 2010년부터 2012년까지 발표된 회색문헌인 회의자료(proceeding)와 백색문헌인 학술논문(journal article)의 초록을 SCOPUS, IEEEXplore, Microsoft academic search에서 수집하였다. 단어 동시출현 네트워크를 분석한 결과 회색문헌의 주요 연구는 분석도구 및 방법으로, 백색문헌의 주요 연구는 바이오인포매틱스의 주요 연구대상인 유전자 발현, 단백질 서열 및 구조 등으로 나타났다.

  • PDF

동시출현단어 분석을 이용한 도서관경영 분야의 지적구조 분석 (A Study on the Analysis of Intellectual Structure of Library Management Studies using Co-Word Analysis)

  • 이정규;이용구
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.23-26
    • /
    • 2013
  • 지식기반사회와 정보홍수시대로 갈수록, 도서관의 존속여부에 대한 고민으로 도서관경영의 중요성은 심화되며, 관련 연구가 많이 이루어지고 있다. 이에 본 연구는 동시출현단어 분석을 통해 도서관경영 분야의 지적구조를 분석하였다. 데이터 수집은 2001~2013년도까지 한국연구재단에 등재된 5개의 문헌정보학 관련 학회지를 대상으로 하였으며, 해당 논문 수는 413건이다. 데이터 처리후 군집분석을 실시하여 9개의 군집을 형성하였으며, 해당 군집은 장서개발, 디지털도서관, 공공도서관, 마케팅 및 조직관리, 국립중앙도서관 및 작은도서관, 인사관리(직무/자격제도), 대학도서관, 학교도서관, 서비스 품질평가이다. 이러한 연구 결과는 기존의 도서관경영 분야의 주제영역과 비교하였다.

  • PDF

동시출현단어분석을 통한 데이터과학 분야의 지적구조에 관한 연구 (A Study on the Intellectual Structure of Data Science Using Co-Word Analysis)

  • 김현정
    • 정보관리학회지
    • /
    • 제34권4호
    • /
    • pp.101-126
    • /
    • 2017
  • 최근 문헌정보학의 관련 분야로 주목받고 있는 데이터과학은 오랫동안 문헌정보학에서 해오던 정보의 수집, 저장, 조직, 분석, 활용 등의 활동을 데이터에 적용하여 그 가치를 이해하려는 학문이며, 통계학과 컴퓨터공학 등 다른 학문분야와의 연계가 필요한 분야이다. 이러한 데이터과학 분야의 연구 영역을 파악하기 위하여 동시출현단어 분석을 사용하여 Web of Science 핵심컬렉션에 수록된 문헌들 중 데이터 과학 관련 자료들을 수집하고, 그 주제범주를 활용하여 네트워크분석을 실시하였다. 총 667건의 자료에 대한 159개의 주제범주를 기술분석하여 데이터과학 관련 연구가 많이 이루어지고 있는 학문분야를 조사하였고, 네트워크분석을 통해 데이터과학 분야 연구영역의 지적구조를 시각적으로 파악하였다. 분석결과, 데이터과학 분야의 연구들은 2개 영역 9개 군집으로 구분되었으며, 주제범주의 용어들 중 중심성이 높은 용어들을 통해 각 군집의 대표적인 주제들을 선정하였다. 연구의 결과는 데이터과학 분야의 연구들에 대한 지적구조를 파악하는데 도움이 될 수 있고, 문헌정보학과의 연계융합전공으로서의 데이터과학 교과과정 개발에 방향성을 제시할 수도 있을 것이다.

동시출현단어 분석 기반 오픈 액세스 분야 지적구조에 관한 연구 (Domain Analysis on the Field of Open Access by Co-Word Analysis)

  • 서선경;정은경
    • 한국비블리아학회지
    • /
    • 제24권1호
    • /
    • pp.207-228
    • /
    • 2013
  • 학술 커뮤니케이션의 변화로 인해 오픈 액세스 분야는 상대적으로 최근에 많은 연구가 이루어지고 있다. 본 연구는 동시출현단어 분석을 사용하여 오픈 액세스 분야의 지적구조를 규명하여 연구동향을 제시하고자 하였다. 이를 위해서 데이터 수집은 Web of Science 기반으로 수행하였다. 검색 대상 기간은 1998년 1월 1일부터 2012년 7월 31일까지이며, Topic검색을 통하여 총 479건의 저널 논문을 수집하였다. 총 479건의 저널 논문 제목과 초록에서 명사구 형태의 키워드는 총 8,643개(문헌 당 18.04개)를 추출하였다. 오픈 액세스 분야의 지적구조 규명을 위해 첫째, 네트워크 분석을 통하여 18개의 세부 주제 영역을 밝혔으며, 오픈 액세스 분야 키워드들의 지적 관계를 시각화하여, 키워드 관계, 중심성 분석을 통한 전역 중심 키워드와 지역 중심이 높은 키워드를 제시하였다. 둘째, 군집분석을 실시하여 형성된 4개의 군집을 MDS지도에 표시하였으며, 각 키워드들 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구의 결과는 오픈 액세스 분야의 지적구조를 밝히며, 향후 연구 방향성 모색에 유용하게 사용될 수 있을 것으로 기대한다.

동시출현 단어분석 기반 스팸 문자 탐지 기법 (Coward Analysis based Spam SMS Detection Scheme)

  • 오하영
    • 정보보호학회논문지
    • /
    • 제26권3호
    • /
    • pp.693-700
    • /
    • 2016
  • 스팸 데이터 셋은 통상적으로 공개적으로 구하기 어렵고 기존 연구들은 대부분 스팸 이메일에 초점이 맞춰져 왔기 때문에 스팸 문자 메시지 자체 특성을 분석하는데 한계가 있었다. 스팸 이메일 특성 분석 활용 및 데이터 마이닝 기법 등의 활용을 통한 기존 연구들이 있었지만, 영향력이 높은 단일 단어를 활용한 스팸 문자 탐지 기법에 한정되어 있다는 한계점이 있다. 본 논문에서는 싱가폴 대학교에서 공개적으로 공개한 스팸 문자메시지를 다 각도에서 실험 및 분석하여 스팸 문자의 특성을 밝히고 동시출현 단어분석 기반의 스팸 문자 탐지 기법을 제안한다. 성능평가 결과, 제안하는 기법의 거짓 양성과 거짓 음성이 2%미만임을 보였다.

동시출현 핵심단어 분석을 활용한 폭발사고 연구 동향 분석 (Analysis of Research Trends of Explosion Accidents Using Co-Occurrence Keyword Analysis)

  • 이영우;김민주;이지원;안우성;권상기
    • 화약ㆍ발파
    • /
    • 제42권2호
    • /
    • pp.12-28
    • /
    • 2024
  • 급속한 에너지 확산을 수반하는 폭발 현상은 인명 및 경제적인 피해를 미치고 있다. 산업의 고도화로 인하여 다양하고 광범위한 폭발사고가 전 세계적으로 발생하고 있으며, 이러한 폭발사고의 예방을 위해서는 정확한 원인 분석이 밑바탕이 되어야 한다. 국내외 폭발사고 관련 연구 분석은 일부 사건들에 대해서 제한적인 범위에서 수행되고 있었다. 본 논문에서는 국제학술지에 게재된 전체 논문들을 대상으로 동시출현 핵심단어 분석을 실시하여 시기별 전체적인 연구 경향과 향후 연구자들이 관심을 가질 수 있는 최신 분야를 도출하고자 하였다. 시기별 핵심단어 분석 결과, 2005년~2014년에는 대체로 논문의 수가 적고 전체적인 핵심단어의 수도 적었지만, 2015년 이후 컴퓨터 시뮬레이션과 인공지능분야가 폭발사고사례 분석에 활용되었으며, 폭발사고의 종류 또한 현재 최신 연구분야인 리튬이온 배터리, 혼합가스 등의 다양한 연구가 활발하게 진행되고 있음을 알 수 있었다.

트위터 관련 연구에 대한 계량정보학적 분석 (A Bibliometric Analysis on Twitter Research)

  • 강범일;이재윤
    • 정보관리학회지
    • /
    • 제31권3호
    • /
    • pp.293-311
    • /
    • 2014
  • 이 연구에서는 계량정보학적 기법을 사용하여 국내 트위터 관련 연구의 동향을 분석하고자 하였다. 이를 위해 KCI에서 검색된 2009년부터 2014년 4월까지의 트위터 관련 논문 539편에서 제목, 초록, 키워드를 추출하여 분석 자료로 삼았다. 프로파일링 기법을 이용해 트위터 관련 연구가 수행된 학문 분야와 저널을 분석하였고, 동시출현단어 분석을 통해 트위터 관련 연구의 세부 주제 영역을 파악하였다. 그 결과, 국내 트위터 관련 연구는 53개 학문분야에서 다양하게 다루어지고 있으며 핵심 분야는 신문방송학, 경영학, 컴퓨터학 분야로 나타났다. 세부 주제로는 선거를 비롯한 정치 관련 이슈가 가장 많이 다루어졌으며, 기업/구매 관련 이슈도 활발히 연구되었음을 확인할 수 있었다.