• 제목/요약/키워드: 의미망

검색결과 896건 처리시간 0.021초

텍스트 마이닝을 이용한 XML 문서 분류 기술 (Classification Techniques for XML Document Using Text Mining)

  • 김천식;홍유식
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.15-23
    • /
    • 2006
  • 인터넷에는 많은 문서가 있고 지금도 새로운 문서가 만들어지고 있다. 따라서 인터넷에 존재하는 문서를 의미 있게 분류하는 것은 향후 문서의 관리 및 질의처리에서 중요한 문제이다. 하지만 지금까지 대부분은 키워드에 기초한 문서 분류방법을 사용하고 있다. 이 방법은 문서를 효율적으로 분류하지 못했다. 또한 의미를 포함한 문서의 분류를 하지 못한다. 사람이 문서를 꼼꼼하게 읽어서 문서를 분류하는 방법이 최선이지만, 시간적인 면이나 효율성에 문제가 있다. 따라서 본 논문에서는 신경망 알고리즘과 C4.5 알고리즘을 이용하여 문서를 분류하고자 한다. 실험 데이터로 XML로 만들어진 이력서 데이터를 사용하여 실험하였다. 실험결과 문서 분류에 가능성을 보였다. 또한, 다양한 문서 분류 응용에 적용하여 좋은 결과를 얻을 것으로 기대한다.

  • PDF

어휘판단 과제 시 보이는 언어현상의 계산주의적 모델 설계 및 구현 (Design and Implementation of Computational Model Simulating Language Phenomena in Lexical Decision Task)

  • 박기남;임희석;남기춘
    • 컴퓨터교육학회논문지
    • /
    • 제9권2호
    • /
    • pp.89-99
    • /
    • 2006
  • 본 논문은 인지신경과학의 연구 방법으로 주로 사용되는 어휘판단과제LDT:ILexical decision task) 시 보이는 언어현상을 모사할 수 있는 계산주의 모델(computational model)을 제안한다. 제안하는 모델은 LDT 시 언어와 독립적으로 관찰되는 언어현상인 빈도효과, 어휘성효과, 단어유사성효과, 시각적쇠퇴효과, 의미점화효과, 그리고 반복점화효과 등을 모사할 수 있도록 설계되었다. 실험결과, 제안한 모델은 통계적으로 유의미하게 빈도효과, 어휘성 효과, 단어유사성 효과, 시각적 쇠퇴효과 그리고 의미점화 효과를 모사할 수 있었으며, LDT 시 인간 피험자와 유사한 양상의 수행 양식을 보였다.

  • PDF

USN, M2M 서비스 융합과 발전 전망

  • 이성현;남동규
    • 정보와 통신
    • /
    • 제28권9호
    • /
    • pp.3-9
    • /
    • 2011
  • 본고에서는 급속히 성장하고 있는 M2M 서비스의 융합과 발전을 위해 어떤 걸림돌이 있으며, 무엇을 준비해야 하는지에 대해 알아보고자 한다. 지난 1T839 정책에서 3대 인프라의 하나로 정의된 USN이 본격 확산에 미흡했던 사항에는 어떤 것들이 있었으며 당시 기술적인 환경과 서비스 사례를 통해 2% 부족했던 것들은 되짚어 보고, USN이 현재 시점에 가지는 의미를 찾아보고자한다. USN 서비스가 활성화 되던 시점에 M2M의 기반기술이라고 할 수 있는 (W)CDMA 등 광역 무선망 기술과의 접목이 어려웠던 부분과 USN의 다양한 근거리 무선 네트워크 기술들이 USN 서비스를 완벽히 구현하고 확산까지 갈 수 없었던 미흡했던 이유를 알아보고자 한다. 또한 M2M의 시작배경에는 어떠한 의미가 있으며, 현재에서 바라본 M2M은 시작과 비교해서 달라진 점이 무엇이며 현재에 요구되는 M2M은 무엇인지에 대해 논의해보고자 한다. 이와 함께 M2M의 다양한 정의와 현재의 M2M을 비교해보고 M2M이 급속히 증가하고 있는 이유들을 찾아본다. M2M 서비스를 크게 나누면 텔레매틱스와 텔레매트리로 나눌 수 있으며 최근에는 차량 관련된 분야에 M2M 서비스가 급속히 증가되고 있는데 해외의 eCall 서비스와 국내의 DTG 연계 M2M 서비스, 국가위험물관리 등 국내외 차량관련 M2M 서비스 사례를 분석해 보고, RFID/USN+LBS+M2M의 융복합 서비스 진화에 대해 알아보고자 한다. 끝으로 M2M 시대의 시대적 요구사항을 반영하여 M2M의 활성화를 위해서 필요한 공공과 민간의 역할을 짚어보고, 우리가 준비해야할 것에 대해 제언하고자 한다.

간호사의 직장 내 괴롭힘에 대한 국내 연구 동향 분석: 의미연결망분석과 토픽모델링 중심 (A Study on Research Trend for Nurses' Workplace Bullying in Korea: Focusing on Semantic Network Analysis and Topic Modeling)

  • 최정실;김영지
    • 한국직업건강간호학회지
    • /
    • 제28권4호
    • /
    • pp.221-229
    • /
    • 2019
  • Purpose: The aim of this study was to identify core keywords and topic groups of workplace bullying researches in the past 10 years for better understanding research trend. Methods: The study was conducted in four steps: 1) collecting abstracts, 2) extracting and cleaning semantic morphemes, 3) building co-occurrence matrix and 4) analyzing network features and clustering topic groups. Results: 437 articles between 2010 and 2019 were retrieved from 5 databases (RISS, NDSL, Google scholar, DBPIA and Kyobo Scholar). Forty-one abstracts from these articles were extracted, and network analysis was conducted using semantic network module. The most important core keywords were 'turnover', 'intention', 'factor', 'program' and 'nursing'. Four topic groups were identified from Korean databases. Major topics were 'turnover' and 'organization culture'. Conclusion: After reviewing previous research, it has been found that turnover intention has been emphasized. Further research focused on various intervention is needed to relieve workplace bullying in nursing field.

명사 어휘의미망을 활용한 문법 검사기의 문맥 오류 결정 규칙 일반화 (Generalization of error decision rules in a grammar checker using Korean WordNet, KorLex)

  • 소길자;이승희;권혁철
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.405-414
    • /
    • 2011
  • 국내에서 가장 일반적으로 사용되고 있는 규칙 기반 오류 검출 방법은 언어 전문가가 한국어 문서에서 자주 발생하는 오류에 대한 검출 규칙을 경험적으로 구축하고 있다. 그러나 이렇게 경험적으로 규칙을 만들면 새로운 패턴의 문장이 나타날 때마다 규칙이 수정되어야 하므로 일관성 있는 오류 검사 및 교정을 기대할 수 없다. 본 논문에서는 이를 해결하려고 최근 개발되고 있는 어휘의미망 중에서 KorLex와 같은 정규화된 언어 자원을 활용하여 단어들의 범주 정보를 추출하고 이를 이용하여 오류 결정 규칙을 일반화한다. 그러나 현재 구축된 KorLex에는 명사의 계층관계 정보는 구축되어 있지만, 문장 요소와의 관계 정보, 즉, 격틀 정보가 부족하다. 본 논문에서는 용언 의미 오류 결정 규칙으로 사용할 선택제약 명사 클래스를 정보이론에 기초한 MDL과 Tree Cut Model을 활용하여 추출하고 이러한 선택제약 명사 클래스를 사용하여 문법 검사기 규칙을 일반화하는 방안을 제안한다. 실험 결과, 혼동하기 쉬운 네 개의 용언에 대해 목적어로 사용된 명사를 선택제약 명사 클래스로 일반화하여 문법 검사기 오류 결정 규칙 수를 평균 64.8%로 줄였고 기존 명사를 사용한 문법 검사기보다 정확도 측면에서 평균 약 6.2%정도 향상된 결과를 얻을 수 있었다.

인터넷 기반 원스톱서비스 시스템 개발에 관한 연구+ -수출컨테이너화물 원스톱서비스 시스템 개발-

  • 박남규;최형림;김현수;박영재;조재형;이철우
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 1999년도 추계학술대회논문집
    • /
    • pp.299-308
    • /
    • 1999
  • 오늘날 우리 나라가 당면한 최우선 경제과제중 하나는 물류부분의 혁신을 통한 국가경쟁력 강화라고 할 수 있으며, 이를 위해 정부도 1993년 물류체계 개선을 위한 장기구상으로 ‘화물유통체계 개선 10개년 기본계획’을 수립하여 적극 추진 중에 있다. 그러나 이러한 노력에도 불구하고 PORT-MIS사용자를 상대로 한 설문조사에서는 선박입출항 업무 관련 서류의 40%, 항만시설 사용 업무와 관련된 서류의 31%, 하역업무 관련 서류의 10%만이 EDI를 활용하고 있었다. EDI 활용이 저조한 사유로는 전송시간이 많이 걸리며, EDI 소프트웨어가 작동되지 않으며, 수신확인이 되지 않기 때문이라 응답을 하였다. 이처럼 오늘날 항만물류산업이 겪고 있는 물류 데이터 흐름이 단절적 현상은 시간이 흐를수록 해결 될 기미가 보이고 있지 않다. 따라서 본 논문에서는 우리 나라가 겪고 있는 물류관련 업무를 한번의 데이터 입력으로 해결할 수 있는 원스톱 서비스 시스템개발을 목표로 우선 PORT-MIS EDI 업무를 처리할 수 있는 시스템을 구축하였다. 이는 향후 화주, 운송사, 선사, 포워더, 창고업자,하역회사, 철도청, 화물터미널, 컨테이너 터미널, 해양수산청, 관세청, 출입국관리사무소, 검역소 사이에 서로 교환되는 적하목록, Booking List, 컨테이너 Pick up정보, 위험물 정보, COPINO 정보를 비롯하여 대 관세청 신고 등 수출컨테이너 화물업무의 전반적인 영역으로까지 쉽게 확대할 수 있을 것이다. 본 연구결과 구축된 시스템은 원천정보를 중앙의 통합데이터베이스에 저장하여 이를 사용자의 요구에 의해 인터넷을 통해 전달하는 FTP와 웹 EDI 방식을 결합한 하이브리드 형태이다.CS Cell 방식에 의한 위치결정방식을 채택하였는데, 이것은 PCS망을 기반으로 데이터를 주고받이며 인터넷 단말기로 확장 가능한 PCS 단말기를 사용해서 위치추적을 하는 시스템이다. 이러한 시스템을 선정하게된 배경은 단말기아 망 이용료의 가격이 저렴하여 현실적으로 트럭이 쉽게 부착할 수 있다는 장점이 있으며 나아가 인터넷 단말기를 활용하여 차량과 관제센터사이에 메시지 전송 등 부가적인 서비스가 가능하기 때문이다.비교한 결과 토사 유출 억제효과는 한지형과 나지형잔디들의 혼합형(MixtureIII)과 자생처리구(MixtureV), Italian ryegrass와 자생식물의 혼합형(MixtureIV)등에서 비교적 낮은 수치를 토사유출량을 기록하였다. 이러한 결과는 자생식물들이 비록 초기생육속도는 외래도입초종에 떨어지지만 토사유출의 억제효과면에서는 이들 외래초종에 필적할 수 있음을 나타낸다고 할 수 있겠다.중량이 약 115kg/$m^2$정도로 나타났다.소 들(환경의 의미, 사람의 목적과 지식)보다 미학적 경험에 주는 영향이 큰 것으로 나타났으며, 모든 사람들에게 비슷한 미학적 경험을 발생시키는 것 이 밝혀졌다. 다시 말하면 모든 사람들은 그들의 문화적인 국적과 사회적 인 직업의 차이, 목적의 차이, 또한 환경의 의미의 차이에 상관없이 아름다 운 경관(High-beauty landscape)을 주거지나 나들이 장소로서 선호했으며, 아름답다고 평가했다. 반면에, 사람들이 갖고 있는 문화의 차이, 직업의 차 이, 목적의 차이, 그리고 환경의 의미의 차이에 따라 경관의 미학적 평가가 달라진 것으로 나타났다.corner$적 의도에 의한 경관구성의 일면을 확인

  • PDF

매스미디어를 통해 본 도시재생의 시대적 동향 - 1920년대~1990년대를 중심으로 - (The Periodical Trend of Urban Regeneration through Mass Media - Focused on the 1920s and 1990s -)

  • 김사랑;이정
    • 한국조경학회지
    • /
    • 제47권2호
    • /
    • pp.28-48
    • /
    • 2019
  • 본 연구는 1920~1999년까지 매스미디어에 나타난 국내 도시재생의 시대적 동향을 의미연결망(Semantic-Network Analysis)분석방법을 활용하여 도시재생에 대한 인식을 파악하고, 향후 지향해야 할 정책적 시사점을 예견하는데 목적이 있다. 분석 결과, 시대별로 기사수가 증가함에 따라 사회적 현상과 이슈의 상호관계가 복잡하게 얽혀서 도시재생의 의미가 형성되어 온 것으로 분석되었다. 전반적으로 '도시'와 '재생' 키워드도 시대별로 등장 빈출이 다르게 나타났는데, 특히 도시개발이 심화되는 1970년을 기점으로 '도시'와 '재생'이 밀접하게 관련되어 나타나는 것으로 분석되었다. 시대적 변천에 따라 '도시'는 1990년도에 이를수록 등장빈도가 높게 나타났으나, '농촌'의 등장빈도가 급격히 하향하는 것으로 분석되었다. 이는 1990년대까지의 도시문제 해결 정책의 부작용으로 나타난 슬럼화 및 침체 현상이 대부분 도시에 집적되어 있었으며, 재생에 있어서 농촌보다 도시의 물리적 환경을 개선하는 목표 중심으로 정책적 논의가 진행되었기 때문으로 해석된다. 1970년대 이후 '개발'과 '재생'의 키워드 분포가 양적 증가 추세를 보이는데, 도시의 외연적 성장을 위한 개발로 인해 도시의 양극화 현상은 두드러지게 나타나 결국 환경적 위협의 가속화를 초래했던 시대적 상황과 인식이 같은 흐름을 보이는 것으로 나타났다. 특히 '재생'의 키워드는 주로 환경문제와 직결되는 쓰레기, 폐품, 오염, 공해 등과 같은 키워드와 연관되어 등장하였는데, 이러한 환경문제의 대두는 1980년대 이후 지속가능성에 대한 관심, 환경 및 생태 친화적 기술과 분야의 발전을 촉진시키는 계기가 되었다. 도시재생과 관련하여 허브 역할을 수행하는 키워드로 '도시', '재생', '환경'의 등장 빈출이 1990년대에 이를수록 증가하는 것으로 나타났는데, 이는 도시재생의 촉발이 사회문제로 제기되었던 '환경'과 밀접한 관계가 있음을 시사한다.

고등학교 수학과 교육과정 중 확률.통계에 나타난 의미의 연결망 구조와 분석 (Network Structure and Analysis on the Meaning of Probability.Statistics in the High School Mathematics Curriculum)

  • 최경호
    • Communications for Statistical Applications and Methods
    • /
    • 제15권2호
    • /
    • pp.245-254
    • /
    • 2008
  • 제7차 교육과정 개편에 따라 고등학교 수학교과 구성에 있어, 확률 통계관련 내용이 과거에 비하여 양적으로 많이 증대되었다. 따라서 내용적인 측면에서도 확률 통계관련 각 영역이 단원 목표를 제대로 달성될 수 있도록 구성된다면, 정보화 사회에 요구되는 보다 효율적인 통계교육이 이루어질 수 있을 것이다. 이에 본 논문에서는 고등학교 수학교과 중 확률 통계관련 내용이 단원의 학습목표를 달성할 수 있도록 구성되어 있는지를, 제7차 고등학교 수학 교육과정 해설서에 제시된 중심용어와 기호를 중심으로 '연결망분석(network analysis)'을 활용하여 알아보았다. 그 결과 확률변수를 매개로 확률분포에 대한 개념과 통계적 추정에 대한 개념을 연결하는 서술구조는 통계적인 측면에서 매우 잘 표현되어 있으나, '전수조사'와 '표본조사'는 여타의 항목과 연결되지 않는 등, 일부에 있어서는 기술상에 문제점을 내포하고 있는 것으로 나타났다.

공공 한영 병렬 말뭉치를 이용한 기계번역 성능 향상 연구 (A Study on the Performance Improvement of Machine Translation Using Public Korean-English Parallel Corpus)

  • 박찬준;임희석
    • 디지털융복합연구
    • /
    • 제18권6호
    • /
    • pp.271-277
    • /
    • 2020
  • 기계번역이란 소스언어를 목적언어로 컴퓨터가 번역하는 소프트웨어를 의미하며 규칙기반, 통계기반 기계번역을 거쳐 최근에는 인공신경망 기반 기계번역에 대한 연구가 활발히 이루어지고 있다. 인공신경망 기계번역에서 중요한 요소 중 하나로 고품질의 병렬 말뭉치를 뽑을 수 있는데 이제까지 한국어 관련 언어쌍의 고품질 병렬 코퍼스를 구하기 쉽지 않은 실정이었다. 최근 한국정보화진흥원의 AI HUB에서 고품질의 160만 문장의 한-영 기계번역 병렬 말뭉치를 공개하였다. 이에 본 논문은 AI HUB에서 공개한 데이터 및 현재까지 가장 많이 쓰인 한-영 병렬 데이터인 OpenSubtitles와 성능 비교를 통해 각각의 데이터의 품질을 검증하고자 한다. 테스트 데이터로 한-영 기계번역 관련 공식 테스트셋인 IWSLT에서 공개한 테스트셋을 이용하여 보다 객관성을 확보하였다. 실험결과 동일한 테스트셋으로 실험한 기존의 한-영 기계번역 관련 논문들보다 좋은 성능을 보임을 알 수 있었으며 이를 통해 고품질 데이터의 중요성을 알 수 있었다.

빅데이터 분석 교육의 문제점과 개선 방안 -학생 과제 보고서를 중심으로 (Problems of Big Data Analysis Education and Their Solutions)

  • 최도식
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.265-274
    • /
    • 2017
  • 본 논문은 빅데이터 분석 교육의 문제점을 고찰해 그 개선 방안을 제시한다. 빅데이터의 특성은 V3에서 V5로 진화하고 있다. 이에 빅데이터 분석 교육도 V5를 감안한 데이터 분석 교육이 되어야 한다. 작금 불확실성의 증대는 데이터 분석의 리스크를 증가시키기에 내적 외적 구조화/비구조화 데이터를 비롯해 교란 요인마저 분석할 때 데이터의 신뢰성은 증가될 수 있다. 그리고 평판분석을 활용할 때 범하기 쉬운 오류가 가변성과 불확실성에 대한 상황 인식이다. 가변성의 측면을 고려해, 다양한 변수와 옵션에 의한 불확실성의 상황을 인식하고 대비한 데이터 분석이 이뤄질 때 데이터에 대한 신뢰성과 정확성은 증가할 수 있다. 사회관계망 분석에서 학생들과 일반 연구자들이 주로 활용하는 것이 텍스톰과 노드엑셀의 노드 분석이다. 사화관계망 분석은 매개중심성에 의한 상황 분석을 통해 다크 데이터를 찾아 이상 현상을 감지하고 현 상황을 분석하여 유용한 의미를 얻고 미래를 예측할 수 있어야 한다.