• 제목/요약/키워드: Language Processing

검색결과 2,691건 처리시간 0.029초

문헌정보학에서의 인공지능과 전문가시스템 교육과정 연구 (A Curricular Study on AI & ES in Library and Information Science)

  • 구본영;박미영
    • 한국문헌정보학회지
    • /
    • 제32권2호
    • /
    • pp.211-232
    • /
    • 1998
  • 본 연구의 목적은 직면하고 있는 기술과 시스템 환경변화에 적합한 정보전문가 양성을 위한 문헌정보학 교육의 내용을 규명해보는데 있다. 그 중에서 현재 정보환경 변화에 따라 요구되는 최신정보기술인 인공지능과 전문가시스템이 필요함을 인식하여 인공지능과 전문가시스템의 어떤 교육내용이 문헌정보학에 도입해야 할 것인가에 대한 해결방안을 모색하고 기본적 자료를 얻어내는데 그 목적이 있다. 본 연구 결과에 따른 내용을 정리하면 다음과 같다. 첫째, 고도의 정보기술과 컴퓨터의 발전으로 인하여 문헌정보학의 전통적인 핵심내용이 새로운 내용 즉 네트워크를 통한 정보원 탐색, 온라인데이터베이스 검색, 정보시스템 분석과 설긴 컴퓨터활용능력, 정보검색전략 개발순으로 나타났다. 둘째. 인공지능과 전문가시스템 교육내용 중에서 문헌정보학 교육에 중요한 내용으로는 데이터베이스처리 시소러스 자연언어처리, 지식표현으로 나타났다. 셋째, 문헌정보학 교수들은 인공지능과 전문가시스템 교과목 주제가 대다수 학생들에게 유용한 주제라고 인식하고 있음이 나타났다. 넷째, 앞으로 사서/정보전문가를 돕는 인공지능과 전문가시스템의 역할이 참고봉사, 편목${\cdot}$ 분류, 정보검색${\cdot}$ 문헌전달 업무에서 더 중요하게 인식하고 있음이 나타났다. 다섯째, 문헌정보학과 교수들이 인공지능과 전문가시스템 교과목 주제를 중요하게 인식함에 따라 앞으로 인공지능과 전문가시스템 교육과정이 국내 문헌정보학 교육과정에 개설될 것으로 나타났으며 인공지능과 전문가시스템 교육내용 중에서 중요하다고 조사된 데이터베이스처리. 시소러스 자연언어처리. 지식표현의 과목은 앞으로 문헌정보학 교육과정에 도입하여야 할 것이다.

  • PDF

항해안전을 위한 AIS와 ECDIS 기반의 문자통신시스템 개발에 관한 연구 (A Study on the Development of Text Communication System based on AIS and ECDIS for Safe Navigation)

  • 안영중;강석용;이윤석
    • 해양환경안전학회지
    • /
    • 제21권4호
    • /
    • pp.403-408
    • /
    • 2015
  • 해상에서 발생하는 선박 간 음성통신의 문제점을 보완하기 위한 방법으로, 언어적 오류와 VHF 사용제한 및 잡음 등에 영향을 받지 않는 텍스트 기반의 통신시스템을 AIS의 통신기능과 ECDIS의 화면전시 및 입력기능을 연계하는 방법에 착안하여 설계하였다. 개발된 문자통신시스템은 메시지를 이용해 정확한 의사전달이 가능하며, 사용자 편의성 향상을 위한 다양한 UI들을 소프트웨어를 통해 구현하였다. 하드웨어의 추가적인 설치와 개조 없이 구현되고, Message Banner Interface를 이용해 통신문장을 키보드 입력 없이 선택만으로 송신할 수 있으며, 자체 메시지 코딩과 디코딩을 통해 처리속도를 향상시키는 장점을 가진다. 문자통신시스템의 실선적용은 사용자의 언어적 한계와 인식오류를 감소시킬 수 있고, 다양한 VHF 음성통신의 문제를 해결할 수 있는 가장 실용적인 대안으로 판단된다. 또한 해상교통량이 많은 수역에서의 VHF 통신량 감소와 텍스트 기반의 정확한 의사전달과 협력동작 요청으로 선박 간 충돌사고 예방에 도움이 될 것이다.

명사 어휘의미망을 활용한 문법 검사기의 문맥 오류 결정 규칙 일반화 (Generalization of error decision rules in a grammar checker using Korean WordNet, KorLex)

  • 소길자;이승희;권혁철
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.405-414
    • /
    • 2011
  • 국내에서 가장 일반적으로 사용되고 있는 규칙 기반 오류 검출 방법은 언어 전문가가 한국어 문서에서 자주 발생하는 오류에 대한 검출 규칙을 경험적으로 구축하고 있다. 그러나 이렇게 경험적으로 규칙을 만들면 새로운 패턴의 문장이 나타날 때마다 규칙이 수정되어야 하므로 일관성 있는 오류 검사 및 교정을 기대할 수 없다. 본 논문에서는 이를 해결하려고 최근 개발되고 있는 어휘의미망 중에서 KorLex와 같은 정규화된 언어 자원을 활용하여 단어들의 범주 정보를 추출하고 이를 이용하여 오류 결정 규칙을 일반화한다. 그러나 현재 구축된 KorLex에는 명사의 계층관계 정보는 구축되어 있지만, 문장 요소와의 관계 정보, 즉, 격틀 정보가 부족하다. 본 논문에서는 용언 의미 오류 결정 규칙으로 사용할 선택제약 명사 클래스를 정보이론에 기초한 MDL과 Tree Cut Model을 활용하여 추출하고 이러한 선택제약 명사 클래스를 사용하여 문법 검사기 규칙을 일반화하는 방안을 제안한다. 실험 결과, 혼동하기 쉬운 네 개의 용언에 대해 목적어로 사용된 명사를 선택제약 명사 클래스로 일반화하여 문법 검사기 오류 결정 규칙 수를 평균 64.8%로 줄였고 기존 명사를 사용한 문법 검사기보다 정확도 측면에서 평균 약 6.2%정도 향상된 결과를 얻을 수 있었다.

전통문화 콘텐츠 표준체계를 활용한 자동 텍스트 분류 시스템 (A System for Automatic Classification of Traditional Culture Texts)

  • 허윤아;이동엽;김규경;유원희;임희석
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.39-47
    • /
    • 2017
  • 한국 문화의 역사, 전통과 관련된 디지털 웹 문서가 증가하게 되었다. 하지만 창작자 또는 전통 문화와 관련된 소재를 찾는 사용자들은 정보를 검색해도 결과가 충분하지 않았으며 원하는 정보를 얻지 못하는 경우가 나타나고 있다. 이런 효과적인 정보를 접하기 위해서는 문서 분류가 필요하다. 과거에 문서 분류는 작업자가 수작업으로 문서 분류하여 시간과 비용이 많이 소비하는 어려움이 있었지만, 최근 기계학습 기반으로 한 자동 문서 분류를 통해 효율적인 문서 분류가 이루어진다. 이에 본 논문은 전통문화 콘텐츠를 체계적인 분류체계로 구성한 한민족정보문화마당 데이터를 기반으로 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발한다. 본 연구는 한민족정보문화마당 텍스트 데이터에 대해 단어 빈도수를 추출하기 위해 TF-IDF모델, Bag-of-Words 모델, TF-IDF/Bag-of-Words를 결합한 모델을 적용하여 각각 SVM 분류 알고리즘을 사용하여 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발하여 성능평가를 확인하였다.

PL/SQL 응용프로그램 전환을 위한 자동화 도구 설계 (Automation Tool Design for PL/SQL Applications Conversion)

  • 지정은;이정근;최용락;신용태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권8호
    • /
    • pp.287-296
    • /
    • 2018
  • 최근 상용 DBMS 시장은 고가의 라이선스 정책과 신속하지 않은 기술 지원 서비스 등에 대한 사용자들의 부담과 불만이 커지면서, 호환성이나 안정성에 문제가 없는 오픈소스 DBMS의 사용에 대한 관심이 확대되고 있다. 이로 인해 DBMS 시장의 약 60% 점유율을 갖고 있는 오라클사 기반의 응용프로그램을 오픈소스 기반의 DBMS로 전환하여 비용을 절감하는 사례가 많아지고 있다. 그러나 오라클사에서 제공하는 PL/SQL의 사용으로 인한 비호환적 문장을 오픈소스 DBMS로 전환 시, 많은 수작업을 동반하게 되어 시간 및 비용 손실이 크다. 따라서 PL/SQL을 표준 SQL로 자동 전환해주는 도구가 요구된다. 제안하는 응용프로그램 전환을 위한 자동화 도구는 PL/SQL을 ANSI 표준 프로그래밍 언어인 Java SP (Stored Procedure)로 전환한다. 자동화 도구 테스트 실행을 통해 입출력 데이터의 동일성을 확인하고, 발생하는 Java SP 전환 오류 수정으로 신뢰성을 검증하여 응용프로그램 전환의 시간과 비용 절감에 기여할 수 있다는 것을 확인했다.

워드문서 콘텐츠의 사용자 XML 콘텐츠로의 변환 및 저장 시스템 개발 (Rule Based Document Conversion and Information Extraction on the Word Document)

  • 주원균;양명석;김태현;이민호;최기석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.555-559
    • /
    • 2006
  • 본 논문은 HWP, DOC와 같은 워드 문서를 대상으로 사용자가 작성한 구조적인 규칙과 XML 기반 워드 문서 변환 기법을 이용함으로써, 사용자의 관심 영역에 해당하는 다양한 형태(표, 리스트 등)의 정보를 효과적으로 추출(변환)하여 저장하기 위한 방법에 관한 것이다. 본 논문에서 제시한 시스템은 3가지의 중요한 요소들로 구성되어 있는데, 1)워드문서의 원시 XML문서로의 변환방법, 2)XML 기반 구조적인 규칙 작성과 규칙을 이용하여 원시 XML 문서에서 정보를 추출(변환)하는 방법, 3)추출 된 정보에서 최종 XML을 생성하거나 DB에 저장하는 방법이 그것이다. 워드문서의 변환을 위해서 독립적으로 동작하는 OCX 기반의 워드문서 변환 데몬(daemon)을 개발하였고, 사용자의 정보 추출(변환)과정을 돕기 위해서 XSLT를 확장한 형태의 스크립트 언어를 개발하였다. 스크립트 언어는 비교적 간단한 문법 구조를 가지고 있고, 데이터 처리를 위한 자체 정의 함수와 변수를 사용한다. 추출된 정보는 원하는 형태의 구조적인 문서로 생성하거나 DB에 저장할 수 있다. 개발한 시스템(PPE)은 워드 문서 원문 정보에 대한 데이터베이스 구축 및 서비스의 제공, 혹은 구축된 데이터베이스를 이용하여 다양한 처리를 하거나 현황 통계를 제공하는 분야에서 유용하게 사용할 수 있다. 실제로 연구과제관리 시스템과 성과정보시스템에 시범 적용하였다.

  • PDF

모바일 레이저 스캐닝 데이터로부터 철도 선로 추출에 관한 연구 (Railway Track Extraction from Mobile Laser Scanning Data)

  • 좌윤석;손건호;원종운;이원춘;송낙현
    • 한국측량학회지
    • /
    • 제33권2호
    • /
    • pp.111-122
    • /
    • 2015
  • 본 연구에서는 모바일 레이저 스캐닝 데이터로부터 철도 선로탐지 및 선로모델 추출을 위한 방법을 제시하였다. 제안된 방법은 크게 세 단계로 구성된다. 첫째, 레이저 포인트로부터 잠재적인 철도 선로지역을 탐지하고, 초기 철도 선로궤적 방향을 추정한다. 둘째, 철도 선로에 관한 선 지식을 이용하여 첫번째 스트립에서 초기 선로위치를 결정한다. 여기서, 스트립은 국부 탐색공간을 나타내며 철도 선로궤적에 수직인 방향으로 정의된다. 마지막으로, 초기 선로위치에서 GMM-EM기반 분류방법을 통해 선로 포인트들을 탐지한 후 초기 선로 모델을 생성하고 스트립을 데이터 처리 기본단위로 하여 tracking by detection관점에서 연속적으로 선로모델을 생성하였다. 제안된 방법의 주요 특징은 다음과 같다. 첫째, 이전 스트립에서 생성된 선로 모델을 가이드 라인으로 다음 스트립에 전파되어 국부 탐색영역을 예측하여 선로 포인트를 탐지하는 하는데 있어서 처리 복잡성을 줄일 수 있었다. 둘째, 선로 포인트 탐지와 선로 모델링을 동시에 진행 함으로써 데이터 처리 시간을 최소화 할 수 있었다. 개발된 알고리즘은 C++ 프로그램 언어로 구현되었고 도시지역에서 MMS 측량을 통해 취득된 LiDAR 데이터(경부선 일부 구간)를 이용하여 성능 테스트를 진행하였다.

전력수용가포털을 위한 구내 통신 및 컴퓨터 네트워크 용량 설계 (Network Capacity Design in the local Communication and Computer Network for Consumer Portal System)

  • 홍준희;최중인;김진호;김창섭;손성용;손광명;장길수;이재복
    • 조명전기설비학회논문지
    • /
    • 제21권10호
    • /
    • pp.89-100
    • /
    • 2007
  • 고전력수용가포털(Consumer Portal)은 소비자의 다양한 장치들과 광역 네트워크, 그리고 에너지서비스사업자(ESP: 한전 등)의 서비스 애플리케이션 플랫폼을 연결하는 물리적 링크이자 논리적 결합으로, 전력서비스 체계에서 소비자-공급자 간 정보교환과 서비스 거래를 담당하는 양방향 통신의 핵심 인프라로서 포털이다. 전력수용가포털(Consumer Portal)의 성공적인 설계와 개발을 위해서는 효율성, 경제성, 확장성을 고려한 네트워크 설계가 선행되어야 한다. 그러나 전력수용가 포털의 네트워크 설계에 필요한 네트워크 용량 설계 모델링에 대한 공학적 연구는 아직 부족한 실정이다. 본 논문에서는 전력수용가포털의 네트워크 설계에 필요한 네트워크 용량 설계 모델링 방법을 논하고 실제 구축 중인 시스템에 적용하였다. 그 결과 기존 네트워크 설계방법의 문제점을 파악하고, 개선하여 네트워크의 최대수용 단말기의 수를 $30{\sim}40$배 증대시킬 수 있는 데이터 수집 알고리즘을 개발할 수 있게 되었다.

광고 글 필터링 모델 적용 및 성능 향상 방안 (Application of Advertisement Filtering Model and Method for its Performance Improvement)

  • 박래근;윤혁진;신의철;안영진;정승도
    • 한국산학기술학회논문지
    • /
    • 제21권11호
    • /
    • pp.1-8
    • /
    • 2020
  • 최근 기하급수적인 인터넷 데이터의 증가로 딥러닝 등의 많은 분야가 발전하였지만 바이럴 마케팅(viral marketing)과 같은 상업적 목적의 광고가 발견되면서 정보증가의 부작용이 발생하고 있다. 이는 양질의 정보를 공유하고자 하는 인터넷의 본질을 훼손하고 있을 뿐만 아니라 사용자는 양질의 정보를 습득하기 위해 검색시간이 증가하는 문제가 야기된다. 이에 본 연구에서는 광고(Ad: Advertisement, 이하 Ad) 글을 정보 전달의 본질을 흐리는 내용의 글이라 정의하였으며 본 정의에 부합하는 정보로 필터링하는 모델을 제안하였다. 제안하는 모델은 광고 필터링 경로와 광고 필터링 성능 개선경로로 구성되었으며 지속적으로 성능이 개선되도록 설계하였다. 광고 글 필터링을 위해 데이터를 수집하고 KorBERT를 사용하여 문서분류를 학습하였다. 본 모델의 성능을 검증하기 위해 실험을 진행하였으며 5개의 주제를 통합한 데이터에 대한 정확도(Accuracy), 정밀도(Precision)는 각각 89.2%, 84.3%의 결과를 나타냈고 광고의 비정형적 특성을 고려하더라도 높은 성능이 보임을 확인하였다. 본 모델을 통해 바이럴 마케팅으로 구성된 문서에서 광고 문단을 판단하고 필터링하여 사용자에게 양질의 정보를 효과적으로 전달하며 검색하는 과정에서 낭비되는 시간과 피로가 감소할 것으로 기대된다.

잠정적 부적합 문서와 어휘 근접도를 반영한 어휘 그래프 기반 질의 확장 (Query Expansion Based on Word Graphs Using Pseudo Non-Relevant Documents and Term Proximity)

  • 조승현;이경순
    • 정보처리학회논문지B
    • /
    • 제19B권3호
    • /
    • pp.189-194
    • /
    • 2012
  • 본 논문에서는 정보검색 성능 향상을 위해 잠정적 적합 문서 및 부적합 문서와 어휘 그래프를 이용한 질의 확장 방법을 제안한다. 언어모델에 의한 초기 검색 결과 상위 문서들은 질의 어휘 조합과 근접도를 기반으로 핵심 질의를 포함하는 문서들로 구성된 핵심 질의 클러스터와 핵심 질의를 포함하지 않는 문서들로 구성된 비핵심 질의 클러스터로 분류된다. 이때, 핵심 질의 클러스터는 잠정적 적합 문서 집합으로, 비핵심 질의 클러스터는 잠정적 부적합 문서 집합으로 본다. 각 클러스터는 어휘들과 질의 어휘와의 가까운 정도에 따라 어휘 그래프로 표현된다. 각 어휘에 대한 중요도는 핵심 질의 클러스터 그래프에서의 어휘 가중치에서 비핵심 질의 클러스터 그래프에서의 어휘의 가중치를 빼서 계산한다. 이는 부적합 문서에서 높은 가중치를 갖는 어휘는 확장 질의에서 제외시키는 역할을 한다. 중요도가 높은 어휘 순으로 확장할 질의를 선택한다. 웹 문서 테스트컬렉션인 TREC WT10g에서의 실험 결과에서 제안 방법이 언어모델(LM)에 비해 평균 정확률의 평균(MAP)에서 9.4% 성능 향상을 보였다.