• 제목/요약/키워드: 용어 네트워크 분석

검색결과 97건 처리시간 0.022초

고등학교 과학 및 생물교과서 과학용어 네트워크 분석 (Analysis of Scientific Item Networks from Science and Biology Textbooks)

  • 박별나;이윤경;구자을;홍영수;김학용
    • 한국콘텐츠학회논문지
    • /
    • 제10권5호
    • /
    • pp.427-435
    • /
    • 2010
  • 교과서에 쓰인 과학 용어 네트워크를 구축하여, 네트워크의 구조, 관련 정보 및 연관 관계를 분석하기 위하여 핵심용어를 도출하였다. 본 연구에서는 과학, 생물1 및 생물2 교과서 각 과목별로 출판사 세 곳을 선정하고 각각의 교과서에서 추출한 용어들을 노드로, 한 문장 안에 있는 과학 용어를 링크로 연결하여 네트워크를 구축하였다. 모든 교과서의 과학 용어 네트워크는 척도 없는(scale-free) 네트워크의 특성을 보여주었다. 복잡한 (complex) 네트워크에서 가중치가 낮은 것부터 제거하는 방법인 k-core 알고리즘을 적용하여 핵심 (core) 네트워크를 구축하였는데, 몇 개의 모듈이 연결되는 형태를 보여주었다. 과학교과서의 경우에는 물리, 화학, 생물, 지구과학 분야별로 크게 네 개의 모듈을 형성하였고, 생물1과 생물2 교과서는 각단원별로 용어들이 모여 있는 특성을 지닌 네트워크를 나타냈다. 본 연구에서 복잡한 네트워크에서 핵심네트워크를 구축하여 유용한 정보를 도출할 수 있는 가능성을 제시하였다.

구술문서에 기초한 자동 용어 네트워크 구축 (Automatic term-network construction for Oral Documents)

  • 박순철
    • 한국산업정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.25-31
    • /
    • 2007
  • 본 연구에서는 문서에 나타나는 용어의 통계값을 이용하여 구술문서자료에 포함되어있는 용어들간의 의미 네트워크를 자동으로 구축하는 시스템을 제안하였다. 본 연구를 위하여 전북 새만금지역에서 채록한 186개의 구술생애사 문서자료를 사용하였으며, 구축된 용어네트워크에서 용어들 사이의 관계는 용어들을 백터화하여 결정하였다. 새만금 구술문서에서 중요단어로 선택된 단어의 수는 약 1700여 개이다. 단어들 사이의 용어네트워크는 구축 시스템을 통해서 실시간 내에 표현할 수 있었다. 이 용어네트워크는 앞으로 전개될 시멘틱 검색시스템 구축에 새로운 장을 열 것이며, 구술문서 분석에 크게 기여할 것으로 기대한다.

  • PDF

교육대학교 학생들의 '전기' 용어의 연상 단어 및 정의에 대한 네트워크 분석 (Network Analysis on Associative Words and Definitions of 'Electricity' Terminology of Education University Students)

  • 송영욱
    • 한국과학교육학회지
    • /
    • 제36권5호
    • /
    • pp.791-800
    • /
    • 2016
  • 이 연구의 목적은 네트워크 분석법을 활용하여 '전기' 용어에 대한 연상 단어 및 정의에 사용한 핵심 단어가 무엇인지 확인하고, 핵심 단어들이 어떻게 활성화되어 인지 구조를 이루는지 알아보는 데 있다. 연구대상은 지방 소재 교육대학교 1학년 대학생 총 83명으로 하였다. 대학생들의 성별과 고등학교 때 물리 과목 이수 여부에 따라 수업 전과 수업 후로 나누어 '전기' 용어에 대한 연상 단어 및 정의를 네트워크 분석하였다. 연구 결과 대학생들이 '전기'하면 가장 많이 떠올리는 단어는 수업 전 '에너지'이고 수업 후에는 '전류', '전자'이다. 그리고 '전기' 정의에 가장 많이 사용한 단어는 수업 전 '에너지', '흐름', '전자'이고 수업 후에는 '전자', '이동', '전하' 이다. '전기' 용어의 연상 단어에는 성별과 고등학교 때 물리 과목 이수 여부에 따라 조금 다른 네트워크 구조를 이루고 있었지만, 수업 후에는 대학생들의 특성에 상관없이 비슷한 네트워크 구조를 보였다. '전기' 용어의 정의에서는 수업 전 성별에 따라서는 비슷한 네트워크 구조를 갖고 있었고, 고등학교 때 물리 과목 이수 여부에 따라서는 조금 다른 네트워크 구조를 보였다. 하지만 수업 후에는 대학생들의 특성에 상관없이 비슷한 네트워크 구조가 나타났다. 끝으로 대학생들의 '전기' 용어에 대한 네트워크 분석 결과에 대한 교육적 시사점을 논의하였다.

온라인 과학 기사 텍스트 마이닝을 통해 분석한 에너지 용어 사용의 맥락 (Analyzing Different Contexts for Energy Terms through Text Mining of Online Science News Articles)

  • 오치영;강남화
    • 과학교육연구지
    • /
    • 제45권3호
    • /
    • pp.292-303
    • /
    • 2021
  • 본 연구에서는 일상생활에서 에너지 용어가 사용되는 맥락을 알아보기 위하여 온라인 과학 기사를 수집하여 언어 네트워크, 토픽 모델링 분석 기법을 활용해 에너지 관련 기사에 사용된 용어의 빈도, 용어 네트워크, 기사의 주제를 분석하였다. 분석에 사용된 자료는 2018.3.1.부터 1년간의 온라인 과학 분야의 기사 중 에너지를 검색어로 하여 10개의 국내 중앙지에서 검색 및 선정된 2,171편이다. 이 기사들을 자연어 처리하여 51,224개의 문장과 507,901개의 단어로 데이터를 구성하였다. R 프로그램을 활용하여 용어 빈도수 분석 및 언어 네트워크 분석을 실시하였고, 에너지 용어 사용의 맥락 탐색을 위해 구조적 토픽 모델링 분석을 적용해 기사의 주제를 도출하였다. 기사에 사용된 용어 중 빈도수가 유난히 높은 용어는 기술, 연구, 개발로 새로운 소식을 알리는 기사의 특성을 반영한 것으로 나타났다. 한편, 기사 2편당 한 번 이상의 빈도로 사용되는 용어에는 산업 관련 용어(산업, 제품, 시스템, 생산, 시장)와 '전기', '환경'과 같이 에너지 관련 용어로 충분히 기대되는 용어들이 있었다. 한편, 에너지 관련 과학 수업에서 자주 사용되는 '태양', '열', '온도', '발전'도 빈도수 상위에 속하는 용어로 드러났다. 용어 네트워크 분석에서는 산업 및 기술과 관련된 용어와 기초과학 및 연구 관련 용어들이 약한 강도이지만 서로 군집을 이루는 것을 확인하였다. 한편, 에너지와 쌍을 이루는 용어의 분석에서는 '에너지 효율'을 비롯해 '에너지 절감', '에너지 소비' 등과 같이 에너지의 사용에 관한 용어들이 다수를 이루고 그 사용 빈도가 가장 높았다. 에너지 용어가 사용되는 맥락은 16개의 주제를 분류한 4가지 영역으로 '첨단산업', '산업', '기초과학', '환경 및 건강'으로 나타났다. 에너지 사용 관련 용어가 상당히 많이 사용된다는 결과는 에너지 수업의 시작점으로 에너지 저급화 개념의 도입이 효과적일 수 있음을 시사한다. 또한, 첨단산업이나 환경 및 건강의 맥락을 에너지 학습에 도입할 필요성도 보여준다. 본 연구에서 드러난 16개 주제에서 보이는 다양한 에너지 용어가 사용되는 맥락을 재구성해 에너지 관련 수업에 활용한다면 학생들이 학교에서의 에너지 학습과 일상적 상황을 통합적으로 인식하는 데 도움이 될 것이다.

이용자 반응 기반 이미지 감정 접근점 확장에 관한 연구 (An Expansion of Affective Image Access Points Based on Users' Response on Image)

  • 정은경
    • 한국비블리아학회지
    • /
    • 제25권3호
    • /
    • pp.101-118
    • /
    • 2014
  • 컴퓨터 정보기술의 발전과 함께 감정 기반 컴퓨팅이 다양한 분야에 빠르게 발전하여 확산되고 있다. 감정 기반 컴퓨팅의 지속적인 발전을 위해서는 이미지와 같은 멀티미디어의 콘텐츠의 감정 기반 색인과 검색이 필수적이다. 그러나 감정과 같은 추상적 개념은 주관적이며 이미지의 하위 수준 속성에서 유추하는데 한계가 있기 때문에 감정 색인은 통상적으로 난제로 여겨진다. 본 연구는 감정 색인 개선을 위해서 이미지에 대하여 이용자가 느끼는 감정 반응을 활용하여 이미지를 감정으로 접근하는데 있어서 확장된 접근점을 제공하는 방안을 고찰하였다. 이를 위하여 유로피아나 DB에서 사랑, 행복, 분노, 공포, 슬픔의 5가지 기본 감정을 표현한 이미지 15건을 선정하여 20명의 연구 참여자에게 보여주고 용어를 수집하였다. 이용자의 이미지 반응에서 수집한 용어는 정련 후 총 399건의 고유한 용어로 나타났다. 고유한 399건의 용어는 전체 1,093회 출현하였으며, 동시출현단어분석을 수행하여 상위 출현한 용어 네트워크를 구현하였다. 동시출현단어분석 기반의 네트워크를 통해서 기본 감정 용어와 함께 빈번하게 출현하는 용어를 규명하였다. 이를 통해 기본 감정용어와 함께 확장되어 제시될 수 있는 용어는 형용사, 동작/행위 표현 등 다양하게 나타났다.

텍스트 마이닝과 소셜 네트워크 분석을 이용한 재난대응 용어분석 (Analyzing Disaster Response Terminologies by Text Mining and Social Network Analysis)

  • 강성경;유환;이영재
    • 경영정보학연구
    • /
    • 제18권1호
    • /
    • pp.141-155
    • /
    • 2016
  • 세월호 침몰사고, 판교 환풍구 붕괴사고 등 재난은 점차 복합적이고 대형화되고 있다. 따라서 이러한 재난에 신속히 대응하기 위한 기관들의 협업 또한 중요해지고 있다. 다수기관 간 협업과정에서는 다양한 용어를 바탕으로 의사소통이 이루어진다. 의사소통은 '용어'를 기반으로 하므로 '용어'에 대한 중요성 또한 간과할 수 없다. 따라서 본 연구에서는 재난현장에서 사용하는 용어를 선정하여 텍스트 마이닝 및 소셜 네트워크 분석(SNA: Social Network Analysis)을 이용해 어떤 용어가 대응과정에 있어 핵심적인 용어인지를 파악해보았다. 텍스트 마이닝의 TDM을 이용하여 역문헌 빈도수를 산출해 용어와 문서 간의 관계를 알아보고, SNA를 통해 노드(용어)와 노드 사이의 관계를 파악하였다. 용어분석의 결과 표현은 용어 간의 유기적인 관계를 시각화할 수 있는 마인드맵(Mind Map)을 이용하였다. 용어는 미국의 NIMS, EMR, 그리고 우리나라의 재난 및 안전관리 기본법을 토대로 온톨로지 개념에 따라 계층적(Class, Object, Instance)으로 분류하였으며. 신문기사와 사설, 정책보고서 등의 정부 간행물에서 선정하였다. 이러한 재난대응 핵심용어의 파악은 재난현장에서 사용하는 용어를 표준화하기 위한 기초자료로 활용할 수 있으며, 온톨로지 개념에 따라 용어들을 계층적으로 분류하였기 때문에 재난 대응에 대한 다양한 자료들을 축적하고 검색하는데 용어의 분류체계를 활용할 수 있다. 이 밖에 사고대응 시나리오 작성 시에도 핵심용어를 활용할 수 있을 것으로 판단된다.

구조적 학술용어사전 데이터베이스 구축에 있어서 용어의 의미관계 형성에 영향을 미치는 요인에 관한 연구 (A Study on the Factors Influencing Semantic Relation in Building a Structured Glossary)

  • 권선영
    • 한국문헌정보학회지
    • /
    • 제48권2호
    • /
    • pp.353-378
    • /
    • 2014
  • 본 연구는 구조적 정의에 의한 학술 용어 사전 데이터베이스 구축을 위해 학술용어의 의미관계 형성에 미치는 요인이 무엇인지를 찾아내고 이러한 요인이 어떠한 영향을 미치고 있는지를 밝히고자 하였다. 이를 위해 2007년부터 2011년 사이에 한국연구재단 등재학술지에 등재된 학술논문에서 학술논문 주제어를 추출하여 이를 대상으로 주제복합성, 언어 네트워크 특성, 출현빈도, 출현패턴을 분석하고 구축된 STNet의 의미관계 형성정도인 용어의 의미적 연결관계 노드의 수와 유형의 수와의 영향 관계를 살펴보았다. 가설 검증을 통해 구조적 학술용어사전의 구축에 있어 의미관계 형성정도에 주요한 영향을 미치는 요인으로 매개 중심성, 출현빈도, 구조적 공백성의 효과크기라는 것을 알 수 있었다. 그리고 용어의 중요성은 일반적으로 알려진 출현빈도를 통한 방법 외에도 연결정도 중심성, 근접 중심성, 매개 중심성, 위세 중심성과 같은 측정방법에 따라서도 판단할 수 있음을 확인하였다. 또한 주제복합성은 직접적으로 의미관계 형성정도에 영향을 미치지는 않지만 용어의 근접 중심성에 영향을 미치기 때문에 크게 4가지의 요인을 고려하여 용어를 선정할 경우 의미관계 형성정도는 높아질 수 있는 것으로 파악 되었다. 본 연구의 결과는 지금까지 용어를 선정하는 프로세스의 주된 방법론인 용어의 출현빈도를 활용하는 방법 이외에도 용어 네트워크상에서의 용어의 위치나 주제복합성 같은 방법론을 적용하여 용어를 선정할 수 있다는 것을 보여준다. 따라서 전문용어 사전을 구축할 때 용어의 네트워크에서의 매개 중심성, 출현빈도, 구조적 공백성의 효과크기, 용어의 주제복합성을 면밀히 판단하여 다각도로 용어를 선정할 경우 전문용어 사전의 질적인 향상과 완성도가 높아질 것을 기대할 수 있다.

빅데이터를 활용한 근골격계 표준의료용어에 대한 키워드 네트워크 분석 (A Keyword Network Analysis of Standard Medical Terminology for Musculoskeletal System Using Big Data)

  • 최병관;최은아;남문희
    • 디지털융복합연구
    • /
    • 제20권5호
    • /
    • pp.681-693
    • /
    • 2022
  • 본 연구는 근골격계 질환으로 입원한 환자의 의무기록지 키워드 네트워크 분석을 통해 근골격계와 관련된 표준의료용어를 유추하여 보건의료현장의 비정형화된 데이터 활용 방안을 제시하기 위함이다. 분석 대상은 2010년부터 2019년까지 근골격계 질환 환자의 입퇴원요약지 145부로, 더아이엠씨(The IMC)에서 개발한 빅데이터 분석 솔루션인 TEXTOM을 활용하여 분석하였다. 1차·2차 정제과정을 통해 도출된 177개의 근골격계 관련 용어를 최종 분석하였다. 연구결과 다빈도 용어는 'Metastasis', 의료용어 체계별 분석 결과에서 임상소견은 'Metastasis', 증상은 'Weakness', 진단은 'Hepatitis', 처치는 'Remove', 신체구조는 'Spine', 약물은 'Oxycodone'이 가장 많이 사용되었다. 이러한 결과를 바탕으로 정형화되지 않은 의료데이터의 분석과 활용 및 관리 방안에 대한 시사점을 제안하고자 한다.

계량서지적 네트워크 분석을 위한 중심성 척도에 관한 연구 (Centrality Measures for Bibliometric Network Analysis)

  • 이재윤
    • 한국문헌정보학회지
    • /
    • 제40권3호
    • /
    • pp.191-214
    • /
    • 2006
  • 최근 일부 계량서지학 연구에서 사회 네트워크 분석 분야의 도구인 중심성 분석 기법을 도입하려는 시도가 나타나고 있다. 그런데 사회 네트워크를 대상으로 개발된 중심성 척도는 노드간 연결에 대한 가중치를 반영하지 않는 단점이 있다 이 연구에서는 가중 네트워크인 계량서지적 자료에 대해서 중심성을 분석할 수 있는 새로운 척도를 네 가지 제시하였다. 제안된 척도의 유용성을 검증하기 위해서 저자동시인용 네트워크. 용어 동시출현 네트워크, 웹사이트 동시링크 네트워크의 세 가지 실제 자료에 대해서 중심성 분석을 수행하였다. 분석 결과에서는 제안된 중심성 척도가 계량서지적 네트워크를 대상으로 개별 노드의 입지와 영향력을 파악하는데 있어서 매우 유용함이 확인되었다

네트워크 기반 코로나바이러스감염증-19 이후 세계화 분석 (Analysis of Globalization After COVID-19 Based on Network)

  • 유제운;김학용
    • 한국콘텐츠학회논문지
    • /
    • 제21권6호
    • /
    • pp.62-70
    • /
    • 2021
  • 2020년은 코로나바이러스감염증-19(코로나19)가 세계적 대유행인 팬데믹(pandemic)으로 인해 전 세계가 혼돈 속에서 보낸 한 해였다. 14세기 중세 유럽의 봉건제도를 무너뜨린 흑사병(페스트), 17세기 스페인에 의해 잉카제국의 멸망을 이끈 천연두, 제1차 세계대전을 조기 종식시킨 스페인독감처럼 팬데믹은 역사 전환의 기점에 있었다. 코로나 19이후 다가올 대변환을 다양한 분야와 관점에서 제시하고 있으나 전환에 대한 이해와 방향이 모호한 측면이 있다. 본 연구에서는 코로나19 이후 '세계가 어떻게 변할 것인가', 다시 말해 세계화에 대한 미래를 네트워크 기반으로 핵심용어를 도출하여 분석하고자 하였다. 세계화, 반세계화, 코로나19 이후 세계화와 디지털화에 관한 네트워크 및 4종류를 통합한 네트워크를 구축하였다. 네트워크로부터 허브 용어, 응집중심성 용어, K-코어 알고리즘을 적용한 단순화 네트워크로 부터 핵심용어를 추출하여 코로나19 이후 세계화의 변화를 분석하였다. 본 연구는 코로나 이후 사회적 변화를 이해하는데 있어서 네트워크를 기반으로 핵심용어를 도출하고 분석하는 방법을 제시한 것이 의미가 있을 것으로 사료된다.