• 제목/요약/키워드: 용어네트워크

검색결과 147건 처리시간 0.02초

구술문서에 기초한 자동 용어 네트워크 구축 (Automatic term-network construction for Oral Documents)

  • 박순철
    • 한국산업정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.25-31
    • /
    • 2007
  • 본 연구에서는 문서에 나타나는 용어의 통계값을 이용하여 구술문서자료에 포함되어있는 용어들간의 의미 네트워크를 자동으로 구축하는 시스템을 제안하였다. 본 연구를 위하여 전북 새만금지역에서 채록한 186개의 구술생애사 문서자료를 사용하였으며, 구축된 용어네트워크에서 용어들 사이의 관계는 용어들을 백터화하여 결정하였다. 새만금 구술문서에서 중요단어로 선택된 단어의 수는 약 1700여 개이다. 단어들 사이의 용어네트워크는 구축 시스템을 통해서 실시간 내에 표현할 수 있었다. 이 용어네트워크는 앞으로 전개될 시멘틱 검색시스템 구축에 새로운 장을 열 것이며, 구술문서 분석에 크게 기여할 것으로 기대한다.

  • PDF

고등학교 과학 및 생물교과서 과학용어 네트워크 분석 (Analysis of Scientific Item Networks from Science and Biology Textbooks)

  • 박별나;이윤경;구자을;홍영수;김학용
    • 한국콘텐츠학회논문지
    • /
    • 제10권5호
    • /
    • pp.427-435
    • /
    • 2010
  • 교과서에 쓰인 과학 용어 네트워크를 구축하여, 네트워크의 구조, 관련 정보 및 연관 관계를 분석하기 위하여 핵심용어를 도출하였다. 본 연구에서는 과학, 생물1 및 생물2 교과서 각 과목별로 출판사 세 곳을 선정하고 각각의 교과서에서 추출한 용어들을 노드로, 한 문장 안에 있는 과학 용어를 링크로 연결하여 네트워크를 구축하였다. 모든 교과서의 과학 용어 네트워크는 척도 없는(scale-free) 네트워크의 특성을 보여주었다. 복잡한 (complex) 네트워크에서 가중치가 낮은 것부터 제거하는 방법인 k-core 알고리즘을 적용하여 핵심 (core) 네트워크를 구축하였는데, 몇 개의 모듈이 연결되는 형태를 보여주었다. 과학교과서의 경우에는 물리, 화학, 생물, 지구과학 분야별로 크게 네 개의 모듈을 형성하였고, 생물1과 생물2 교과서는 각단원별로 용어들이 모여 있는 특성을 지닌 네트워크를 나타냈다. 본 연구에서 복잡한 네트워크에서 핵심네트워크를 구축하여 유용한 정보를 도출할 수 있는 가능성을 제시하였다.

의미 네트워크 모델을 이용한 탐색 용어 선택 시스템의 설계 및 구현에 관한 연구

  • 이효숙
    • 정보관리학회지
    • /
    • 제5권1호
    • /
    • pp.131-152
    • /
    • 1988
  • 본 연구에서는 컴퓨터를 이용하는 탐색 시스템에서 탐색 용어와 관련된 제한점을 해결하고자 의미 네트워크 모델에 지식 베이스를 설계하였다. 이것은 탐색 전략에서 주제분 야의 용어 및 용어간의 어의적 관계에 대한 지식을 확장 이용하였을 때 검색의 효율을 높이 는 데에 촛점을 두었다. 이를 위해서 정보의 탐색과 지식 표현에 관한 문헌 연구를 하였으 며, 실제로 한글 문헌의 화학 공학분야에서 색인어 실험을 통하여 '유체의 흐름'과 '연소'에 관한 지식 베이스를 구성하였다. 탐색 방법은 두가지로 구분되었는데 용어에 관한 탐색과 질문식과 관련된 문헌 검색으로 실시되었다.

  • PDF

구조적 학술용어사전 데이터베이스 구축에 있어서 용어의 의미관계 형성에 영향을 미치는 요인에 관한 연구 (A Study on the Factors Influencing Semantic Relation in Building a Structured Glossary)

  • 권선영
    • 한국문헌정보학회지
    • /
    • 제48권2호
    • /
    • pp.353-378
    • /
    • 2014
  • 본 연구는 구조적 정의에 의한 학술 용어 사전 데이터베이스 구축을 위해 학술용어의 의미관계 형성에 미치는 요인이 무엇인지를 찾아내고 이러한 요인이 어떠한 영향을 미치고 있는지를 밝히고자 하였다. 이를 위해 2007년부터 2011년 사이에 한국연구재단 등재학술지에 등재된 학술논문에서 학술논문 주제어를 추출하여 이를 대상으로 주제복합성, 언어 네트워크 특성, 출현빈도, 출현패턴을 분석하고 구축된 STNet의 의미관계 형성정도인 용어의 의미적 연결관계 노드의 수와 유형의 수와의 영향 관계를 살펴보았다. 가설 검증을 통해 구조적 학술용어사전의 구축에 있어 의미관계 형성정도에 주요한 영향을 미치는 요인으로 매개 중심성, 출현빈도, 구조적 공백성의 효과크기라는 것을 알 수 있었다. 그리고 용어의 중요성은 일반적으로 알려진 출현빈도를 통한 방법 외에도 연결정도 중심성, 근접 중심성, 매개 중심성, 위세 중심성과 같은 측정방법에 따라서도 판단할 수 있음을 확인하였다. 또한 주제복합성은 직접적으로 의미관계 형성정도에 영향을 미치지는 않지만 용어의 근접 중심성에 영향을 미치기 때문에 크게 4가지의 요인을 고려하여 용어를 선정할 경우 의미관계 형성정도는 높아질 수 있는 것으로 파악 되었다. 본 연구의 결과는 지금까지 용어를 선정하는 프로세스의 주된 방법론인 용어의 출현빈도를 활용하는 방법 이외에도 용어 네트워크상에서의 용어의 위치나 주제복합성 같은 방법론을 적용하여 용어를 선정할 수 있다는 것을 보여준다. 따라서 전문용어 사전을 구축할 때 용어의 네트워크에서의 매개 중심성, 출현빈도, 구조적 공백성의 효과크기, 용어의 주제복합성을 면밀히 판단하여 다각도로 용어를 선정할 경우 전문용어 사전의 질적인 향상과 완성도가 높아질 것을 기대할 수 있다.

교육대학교 학생들의 '전기' 용어의 연상 단어 및 정의에 대한 네트워크 분석 (Network Analysis on Associative Words and Definitions of 'Electricity' Terminology of Education University Students)

  • 송영욱
    • 한국과학교육학회지
    • /
    • 제36권5호
    • /
    • pp.791-800
    • /
    • 2016
  • 이 연구의 목적은 네트워크 분석법을 활용하여 '전기' 용어에 대한 연상 단어 및 정의에 사용한 핵심 단어가 무엇인지 확인하고, 핵심 단어들이 어떻게 활성화되어 인지 구조를 이루는지 알아보는 데 있다. 연구대상은 지방 소재 교육대학교 1학년 대학생 총 83명으로 하였다. 대학생들의 성별과 고등학교 때 물리 과목 이수 여부에 따라 수업 전과 수업 후로 나누어 '전기' 용어에 대한 연상 단어 및 정의를 네트워크 분석하였다. 연구 결과 대학생들이 '전기'하면 가장 많이 떠올리는 단어는 수업 전 '에너지'이고 수업 후에는 '전류', '전자'이다. 그리고 '전기' 정의에 가장 많이 사용한 단어는 수업 전 '에너지', '흐름', '전자'이고 수업 후에는 '전자', '이동', '전하' 이다. '전기' 용어의 연상 단어에는 성별과 고등학교 때 물리 과목 이수 여부에 따라 조금 다른 네트워크 구조를 이루고 있었지만, 수업 후에는 대학생들의 특성에 상관없이 비슷한 네트워크 구조를 보였다. '전기' 용어의 정의에서는 수업 전 성별에 따라서는 비슷한 네트워크 구조를 갖고 있었고, 고등학교 때 물리 과목 이수 여부에 따라서는 조금 다른 네트워크 구조를 보였다. 하지만 수업 후에는 대학생들의 특성에 상관없이 비슷한 네트워크 구조가 나타났다. 끝으로 대학생들의 '전기' 용어에 대한 네트워크 분석 결과에 대한 교육적 시사점을 논의하였다.

IoT 기술과 보안

  • 김호원;김동규
    • 정보보호학회지
    • /
    • 제22권1호
    • /
    • pp.7-13
    • /
    • 2012
  • 최근까지 정보 기술 분야에서는 유비쿼터스(Ubiquitous)라는 용어가 크게 유행한 척이 있다. 현재는 다소 식상하게 들리는 용어일지도 모르지만 사물의 지능화와 통신화라는 유비쿼터스 개념은 이미 우리의 생활에 깊이 파고 들어왔다. 최근 유행하는 IT 기술인 스마트폰이나 지능형 전력망, 와이파이, 소셜 네트워크, 센싱 데이터 처리 기술과 개념은 이러한 유비쿼터스 기술의 대표적인 사례로 볼 수 있다. 국내에서 는 이러한 유비쿼터스라는 개념을 유비쿼터스 센서 네트워크(Ubiquitous Sensor Network: USN)라는 용어로서 2004년부터 정보통신부 혹은 지식경제부의 적극적인 지원에 힘입어 많은 기술적/산업적 성과를 이루기도 했다. 하지만 이러한 USN은 센서네트워크 개념으로 제한적으로 오용되는 경우가 많았다 이에 본고에서는 이러한 유비쿼터스 환경을 실현하는 사물의 지능화/통신화에 대한 기술 동향과 보안 기술을 논하기 위해서 USN과 거의 비슷한 개념이지만 국내외적으로 더욱 보편적으로 사용되고 있는 IoT(Intemet of Things) 용어를 사용할 것이며, 이러한 IoT에 대한 기술 동향과 보안 기술을 논하고자 한다.

이용자 반응 기반 이미지 감정 접근점 확장에 관한 연구 (An Expansion of Affective Image Access Points Based on Users' Response on Image)

  • 정은경
    • 한국비블리아학회지
    • /
    • 제25권3호
    • /
    • pp.101-118
    • /
    • 2014
  • 컴퓨터 정보기술의 발전과 함께 감정 기반 컴퓨팅이 다양한 분야에 빠르게 발전하여 확산되고 있다. 감정 기반 컴퓨팅의 지속적인 발전을 위해서는 이미지와 같은 멀티미디어의 콘텐츠의 감정 기반 색인과 검색이 필수적이다. 그러나 감정과 같은 추상적 개념은 주관적이며 이미지의 하위 수준 속성에서 유추하는데 한계가 있기 때문에 감정 색인은 통상적으로 난제로 여겨진다. 본 연구는 감정 색인 개선을 위해서 이미지에 대하여 이용자가 느끼는 감정 반응을 활용하여 이미지를 감정으로 접근하는데 있어서 확장된 접근점을 제공하는 방안을 고찰하였다. 이를 위하여 유로피아나 DB에서 사랑, 행복, 분노, 공포, 슬픔의 5가지 기본 감정을 표현한 이미지 15건을 선정하여 20명의 연구 참여자에게 보여주고 용어를 수집하였다. 이용자의 이미지 반응에서 수집한 용어는 정련 후 총 399건의 고유한 용어로 나타났다. 고유한 399건의 용어는 전체 1,093회 출현하였으며, 동시출현단어분석을 수행하여 상위 출현한 용어 네트워크를 구현하였다. 동시출현단어분석 기반의 네트워크를 통해서 기본 감정 용어와 함께 빈번하게 출현하는 용어를 규명하였다. 이를 통해 기본 감정용어와 함께 확장되어 제시될 수 있는 용어는 형용사, 동작/행위 표현 등 다양하게 나타났다.

텍스트 마이닝과 소셜 네트워크 분석을 이용한 재난대응 용어분석 (Analyzing Disaster Response Terminologies by Text Mining and Social Network Analysis)

  • 강성경;유환;이영재
    • 경영정보학연구
    • /
    • 제18권1호
    • /
    • pp.141-155
    • /
    • 2016
  • 세월호 침몰사고, 판교 환풍구 붕괴사고 등 재난은 점차 복합적이고 대형화되고 있다. 따라서 이러한 재난에 신속히 대응하기 위한 기관들의 협업 또한 중요해지고 있다. 다수기관 간 협업과정에서는 다양한 용어를 바탕으로 의사소통이 이루어진다. 의사소통은 '용어'를 기반으로 하므로 '용어'에 대한 중요성 또한 간과할 수 없다. 따라서 본 연구에서는 재난현장에서 사용하는 용어를 선정하여 텍스트 마이닝 및 소셜 네트워크 분석(SNA: Social Network Analysis)을 이용해 어떤 용어가 대응과정에 있어 핵심적인 용어인지를 파악해보았다. 텍스트 마이닝의 TDM을 이용하여 역문헌 빈도수를 산출해 용어와 문서 간의 관계를 알아보고, SNA를 통해 노드(용어)와 노드 사이의 관계를 파악하였다. 용어분석의 결과 표현은 용어 간의 유기적인 관계를 시각화할 수 있는 마인드맵(Mind Map)을 이용하였다. 용어는 미국의 NIMS, EMR, 그리고 우리나라의 재난 및 안전관리 기본법을 토대로 온톨로지 개념에 따라 계층적(Class, Object, Instance)으로 분류하였으며. 신문기사와 사설, 정책보고서 등의 정부 간행물에서 선정하였다. 이러한 재난대응 핵심용어의 파악은 재난현장에서 사용하는 용어를 표준화하기 위한 기초자료로 활용할 수 있으며, 온톨로지 개념에 따라 용어들을 계층적으로 분류하였기 때문에 재난 대응에 대한 다양한 자료들을 축적하고 검색하는데 용어의 분류체계를 활용할 수 있다. 이 밖에 사고대응 시나리오 작성 시에도 핵심용어를 활용할 수 있을 것으로 판단된다.

온라인 과학 기사 텍스트 마이닝을 통해 분석한 에너지 용어 사용의 맥락 (Analyzing Different Contexts for Energy Terms through Text Mining of Online Science News Articles)

  • 오치영;강남화
    • 과학교육연구지
    • /
    • 제45권3호
    • /
    • pp.292-303
    • /
    • 2021
  • 본 연구에서는 일상생활에서 에너지 용어가 사용되는 맥락을 알아보기 위하여 온라인 과학 기사를 수집하여 언어 네트워크, 토픽 모델링 분석 기법을 활용해 에너지 관련 기사에 사용된 용어의 빈도, 용어 네트워크, 기사의 주제를 분석하였다. 분석에 사용된 자료는 2018.3.1.부터 1년간의 온라인 과학 분야의 기사 중 에너지를 검색어로 하여 10개의 국내 중앙지에서 검색 및 선정된 2,171편이다. 이 기사들을 자연어 처리하여 51,224개의 문장과 507,901개의 단어로 데이터를 구성하였다. R 프로그램을 활용하여 용어 빈도수 분석 및 언어 네트워크 분석을 실시하였고, 에너지 용어 사용의 맥락 탐색을 위해 구조적 토픽 모델링 분석을 적용해 기사의 주제를 도출하였다. 기사에 사용된 용어 중 빈도수가 유난히 높은 용어는 기술, 연구, 개발로 새로운 소식을 알리는 기사의 특성을 반영한 것으로 나타났다. 한편, 기사 2편당 한 번 이상의 빈도로 사용되는 용어에는 산업 관련 용어(산업, 제품, 시스템, 생산, 시장)와 '전기', '환경'과 같이 에너지 관련 용어로 충분히 기대되는 용어들이 있었다. 한편, 에너지 관련 과학 수업에서 자주 사용되는 '태양', '열', '온도', '발전'도 빈도수 상위에 속하는 용어로 드러났다. 용어 네트워크 분석에서는 산업 및 기술과 관련된 용어와 기초과학 및 연구 관련 용어들이 약한 강도이지만 서로 군집을 이루는 것을 확인하였다. 한편, 에너지와 쌍을 이루는 용어의 분석에서는 '에너지 효율'을 비롯해 '에너지 절감', '에너지 소비' 등과 같이 에너지의 사용에 관한 용어들이 다수를 이루고 그 사용 빈도가 가장 높았다. 에너지 용어가 사용되는 맥락은 16개의 주제를 분류한 4가지 영역으로 '첨단산업', '산업', '기초과학', '환경 및 건강'으로 나타났다. 에너지 사용 관련 용어가 상당히 많이 사용된다는 결과는 에너지 수업의 시작점으로 에너지 저급화 개념의 도입이 효과적일 수 있음을 시사한다. 또한, 첨단산업이나 환경 및 건강의 맥락을 에너지 학습에 도입할 필요성도 보여준다. 본 연구에서 드러난 16개 주제에서 보이는 다양한 에너지 용어가 사용되는 맥락을 재구성해 에너지 관련 수업에 활용한다면 학생들이 학교에서의 에너지 학습과 일상적 상황을 통합적으로 인식하는 데 도움이 될 것이다.

데이터 활용률 제고를 위한 기술 용어의 상호 네트워크 생성과 통제 (Generating and Controlling an Interlinking Network of Technical Terms to Enhance Data Utilization)

  • 정도헌
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.157-182
    • /
    • 2018
  • 빅 데이터 시대에 접어들면서 저장 기술과 처리 기술이 급속도로 발전함에 따라, 과거에는 간과되었던 롱테일(long tail) 데이터가 많은 기업과 연구자들에게 관심의 대상이 되고 있다. 본 연구는 롱테일 법칙의 영역에 존재하는 데이터의 활용률을 높이기 위해 텍스트 마이닝 기반의 기술 용어 네트워크 생성 및 통제 기법을 제안한다. 특히 텍스트 마이닝의 편집 거리(edit distance) 기법을 이용해 학문분야에서 사용되는 기술 용어의 상호 네트워크를 자동으로 생성하는 효과적인 방안을 제시하였다. 데이터의 활용률 향상 실험을 위한 데이터 수집을 위해 LOD(linked open data) 환경을 이용하였으며, 이 과정에서 효과적으로 LOD 시스템의 데이터를 활용하는 기법과 용어의 패턴 처리 알고리즘을 제안하였다. 마지막으로, 생성된 기술 용어 네트워크의 성능 측정을 통해 제안한 기법이 롱테일 데이터의 활용률 제고에 효과적이었음을 확인하였다.