• 제목/요약/키워드: 웹 검색

검색결과 2,248건 처리시간 0.036초

텍스트 마이닝 기법을 이용한 컴퓨터공학 및 정보학 분야 연구동향 조사: DBLP의 학술회의 데이터를 중심으로 (Investigation of Topic Trends in Computer and Information Science by Text Mining Techniques: From the Perspective of Conferences in DBLP)

  • 김수연;송성전;송민
    • 정보관리학회지
    • /
    • 제32권1호
    • /
    • pp.135-152
    • /
    • 2015
  • 이 논문의 연구목적은 컴퓨터공학 및 정보학 관련 연구동향을 분석하는 것이다. 이를 위해 텍스트마이닝 기법을 이용하여 DBLP(Digital Bibliography & Library Project)의 학술회의 데이터를 분석하였다. 대부분의 연구동향 분석 연구가 계량서지학적 연구방법을 사용한 것과 달리 이 논문에서는 LDA(Latent Dirichlet Allocation) 기반 다항분포 토픽모델링 기법을 이용하였다. 가능하면 컴퓨터공학 및 정보학과 관련된 광범위한 자료를 수집하기 위해서 DBLP에서 컴퓨터공학 및 정보학과 관련된 353개의 학술회의를 수집 대상으로 하였으며 2000년부터 2011년 기간 동안 출판된 236,170개의 문헌을 수집하였다. 토픽모델링 결과와 주제별 문헌 수, 주제별 학술회의 수를 조사하여 2000년부터 2011년 사이의 주제별 상위 저자와 주제별 상위 학술회의를 제시하였다. 주제동향 분석 결과 네트워크 관련 연구 주제 분야는 성장 패턴을 보였으며, 인공지능, 데이터마이닝 관련 연구 분야는 쇠퇴 패턴을 나타냈고, 지속 패턴을 보인 주제는 웹, 텍스트마이닝, 정보검색, 데이터베이스 관련 연구 주제이며, HCI, 정보시스템, 멀티미디어 시스템 관련 연구 주제 분야는 성장과 하락을 지속하는 변동 패턴을 나타냈다.

LSA모형에서 다의어 의미의 표상 (Representation of ambiguous word in Latent Semantic Analysis)

  • 이태헌;김청택
    • 인지과학
    • /
    • 제15권2호
    • /
    • pp.23-31
    • /
    • 2004
  • 잠재의미분석은 단어 의미를 동일한 맥락 (문장/문서) 하에서 동시에 제시되는 단어들의 공기성(co-occurence)으로 정의한다. 이 분석에서 한 단어는 맥락들을 대표하는 측들로 구성된 다차원 상의 한 점으로 표상 되며, 단어 의미는 각 단어가 맥락 속에서 등장한 빈도로 정의된다. 이 다차원 의미공간은 SVD를 통하여 차원이 축소되어 추상된 의미를 표상 한다. 이 연구는 다의어의 표상이 가능하도록 LSA를 발전시켰다. 제안된 LSA는 축에 대한 해석이 가능하도록 축의 회전을 도입하였으며 다의어 표상을 가능하게 하였다. 시뮬레이션에서는, 먼저 LSA에 의해 산출된 단어-맥락 빈도표에서 다의어를 포함하고 있는 문서들만을 재 수집한 다음 문서들을 다의어 의미별로 분류하였다. 두 번째 단계에서는 다의어의 특정의미에 대한 표상을 분류된 단어-맥락 빈도표에서 비해당 의미에 대한 맥락들을 제거한 후 LSA를 적용하여 구성하였다. 시뮬레이션 결과는 다의어의 의미들을 LSA가 표상 할 수 있음을 보여주었다. 이는 축회전을 포함한 LSA가 다의어 다중의미를 표상 할 수 있고 실용적인 측면에서 웹검색 엔진에도 적용될 수 있음을 시사한다.

  • PDF

거리반경기반 대표문자열 문제의 NP-완전 (The Consensus String Problem based on Radius is NP-complete)

  • 나중채;심정섭
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권3호
    • /
    • pp.135-139
    • /
    • 2009
  • 여러 문자열들을 비교하여 유사성 또는 거리(오차)를 계산하는 문제는 패턴매칭, 웹검색 바이오인포매틱스, 컴퓨터 보안 등 다양한 응용 분야와의 연관성으로 인해 활발히 연구되어 왔다. 주어진 문자열 집합 내의 여러 문자열들의 거리를 비교하기 위해 주어진 집합 내의 모든 문자열들을 대표하는 한 문자열(대표문자열)을 찾는 방법이 있다. 대표문자열 방법은 주어진 문자열 집합과 가장 유사한 한 문자열을 찾는 방법으로 주로 이용되는 목적함수는 거리반경과 거리합이 있다. 거리반경은 집합 내의 문자열들과 특정 문자열과의 거리들의 최대값으로 정의되며, 모든 문자열들 중에서 최소의 거리반경을 만드는 문자열을 주어진 문자열 집합에 대한 거리반경기반 대표문자열이라 한다. 거리합은 집합 내의 문자열들과 특정 문자열과의 거리들의 합으로 정의되며, 모든 문자열들 중에서 최소의 거리합을 만드는 문자열을 주어진 문자열집합에 대한 거리합기반 대표문자열이라 한다. 본 논문에서는 메트릭 거리함수에 대해 거리반경기반 대표문자열 문제가 NP-완전임을 증명한다.

User Interaction이 많은 시스템 환경에서의 프로세스 모델리을 지원하기 위한 지식베이스 시스템 (A knowledge-based system to support process modeling in a system environment with high user interaction)

  • 김수연;서의호;황현석
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.417-426
    • /
    • 2000
  • 정보 시스템 개발은 크게 계획, 분석, 설계, 구축의 네 단계로 이루어진다. 이중 사용자 요구사항을 파악하는 분석 단계는 시스템개발 수명주기에 있어 가장 큰 비중을 갖는다. 또한 수명주기의 초기 단계에서 발견되지 못한 결점은 개발이 진행될수록 수정하는데 많은 비용과 노력을 필요로 하게 되어 분석 결과물의 품질은 전체 시스템 품질에 큰 영향을 미치게 된다. 분석 단계의 주요 작업은 데이터 모델링과 프로세스 모델링이다. 이중 데이터 모델리을 위한 지식베이스 시스템 개발에 대한 노력은 기존 연구에서 수행되어 왔으나 프로세스 모델링을 위한 지식베이스 시스템에 대한 연구는 부족하다. 특히 최근 User Interaction이 많은 시스템이 점점 증가하고 있는 추세에 적합한 프로세스 모델링 방법과 지식베이스에 대한 연구가 필요하다.이 연구에서는 사용자 상호작용이 많은 시스템 환경에서의 프로세스 모델링을 위한 절차를 제안하고, 제안된 절차를 효과적으로 지원하고 결과물의 품질을 보증하기 위한 지식베이스 시스템을 구축한다. 모델은 다음의 주요 작업들로 구성된다: 이벤트 분석, 프로세스 분석, 이벤트/프로세스 상호작용 분석. 이벤트 분석은 영향을 주는 이벤트와 그로 인해 수행되어야 하는 업무 절차(Response)를 파악한다. 프로세스 분석은 이벤트 분석과는 독립적으로 수행되며 상위 수준의 업무부터 최하위 수준의 프로세스까지 도출한다. 이벤트/프로세스 상호작용 분석은 이벤트와 프로세스의 분석 결과를 상호 검증하기 위하여 실시된다. 제안된 프로세스 모델링 방법을 지원하기 위한 지식베이스 시스템을 웹 환경에서 구현하였다. 구현된 지능형 robot과 spider 등으로 구성된, 신뢰성 있고 지능적인 MP3 검색 엔진 지원 시스템의 설계와 구현 결과 그리고 성능 등을 종합적으로 요약한다.실어증 환자들은 화시적 대명사를 조응적 대명사보다 더 잘 처리하는 동일한 결과를 보였다. 이러한 실험 결과들은 실어증 환자들이 뇌손상으로 인해 문법적 언어처리에는 어려움을 보이지만 비언어적인, 세상 지식과 관련된 화시적 대명사의 처리는 가능할 것이라는 가설을 뒷받침 해준다. 또한 이러한 실험 결과를 통해 대명사의 기능적인 측면에서 화시와 조응의 처리가 구분되어 있음을 보여준다.l mechanism is concentrate on only the reaction zone. As strain rate and CO2 quantity increase, NO production is remarkably augmented.our 10%를 대용한 것이 무첨가한 것보다 많이 단단해졌음을 알 수 있었다. 혼합중의 반죽의 조사형 전자현미경 관찰로 amarans flour로 대체한 gluten이 단단해졌음을 알수 있었다. 유화제 stearly 칼슘, 혹은 hemicellulase를 amarans 10% 대체한 밀가루에 첨가하면 확연히 비용적을 증대시킬 수 있다는 사실을 알 수 있었다. quinoa는 명아주과 Chenopodium에 속하고 페루, 볼리비아 등의 고산지에서 재배 되어지는 것을 시료로 사용하였다. quinoa 분말은 중량의 5-20%을 quinoa를 대체하고 더욱이 분말중량에 대하여 0-200ppm의 lipase를 lipid(밀가루의 2-3배)에 대

  • PDF

국내 정보학분야 연구동향 분석, 2000-2011 (Detecting Research Trends in Korean Information Science Research, 2000-2011)

  • 서은경;유소영
    • 정보관리학회지
    • /
    • 제30권4호
    • /
    • pp.215-239
    • /
    • 2013
  • 21세기에 들어서서 디지털 정보환경이 발빠르게 변화함에 따라 국내 정보학 연구 역시 많은 발전과 변화를 겪고 있는 것을 산학계 모두 인지하고 있지만 실제 2000년부터 현재까지 어느 정도로 변화되었는지를 분석한 논문은 많지 않다. 이에 따라 본 연구는 2000년에서부터 2011기간동안 연구재단에 등재된 문헌정보학 관련 학회지에 수록된 정보학분야 논문 1,007편의 논문을 대상으로 정보학분야의 연구동향을 분석하였다. 먼저 시간에 따른 연구주제의 변화를 살펴보기 위하여 논문 데이터를 주제 범주화 한 후, 각 주제 범주 내에서의 논문 및 주요 키워드의 성장률을 시계열적으로 분석하였다. 그리고 단어 동시출현 네트워크를 2000-2011년뿐 아니라 2000-2005년과 2006-2011년의 두 시기로 나누어 시각화하고 분석함으로써, 한국의 정보학 분야의 연구경향의 변화를 살펴보았다. 분석 결과, 지난 12년간의 한국의 정보학 연구는 정보시스템중심적 연구에서 이를 도서관에 적용하는 도서관응용적 연구로 나아가고 있는 것을 확인하였다. 특히 지식관리, 웹기반 시스템 평가, 정보검색 분야에서 두드러지게 변화가 나타났다. 다른 연구의 결과와 비교해 볼 때, 이 연구는 정보학 연구분야의 한국 로컬화의 변화를 찾아냈다는 점에서 의의가 있다고 할 수 있다.

오픈소스 도구를 이용한 기록정보 링크드 오픈 데이터 구축 절차 연구 (A Study on the Procedure for Constructing Linked Open Data of Records Information by Using Open Source Tool)

  • 하승록;임진희;이해영
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.341-371
    • /
    • 2017
  • 웹을 통해 제공되는 서비스는 현재 문서중심에서 데이터 중심으로 변화를 겪고 있으며, 그 변화의 중심에는 Linked Open Data(LOD)가 존재한다. 본 연구는 이러한 흐름에 부응하여 기록정보의 LOD 구축을 위한 구체적인 절차와 방법을 살펴보고자 하였다. 또한 소규모 아카이브의 서비스 지속가능성을 염두에 두고, 오픈소스 소프트웨어를 활용하여 LOD 구축 절차를 진행하는 범례를 제시하고자 했다. 이에 본 연구에서는 LOD 구축을 위한 5단계의 프레임워크를 제안했다. 그리고 일상아카이브인 '인간과 기억 아카이브'의 일기 기록물 컬렉션을 수집하여, 제안된 5단계 프레임워크에 따라 오픈소스 소프트웨어인 Protege와 Apache Jena Fuseki를 활용하여 POC(Proof of concept)를 진행하였다. 오픈소스를 활용하여 기록정보의 LOD를 구축한 뒤, 상호연결(Interlinking)과 SPARQL 검색을 통해서 외부 LOD와 연결되는 모습을 확인할 수 있었다. 또한 기록정보의 LOD 구축 절차 진행과정의 경험을 바탕으로 내용정보 기술의 품질 향상, 아키비스트의 역량 고도화, 기록정보의 접근성 향상을 위한 상호연결 고도화, LOD 서비스의 수준 결정, LOD 구축을 위한 도구 선정 등, 기록관 LOD 구축을 위한 필요요건을 제시했다.

SWAT: 분산 인-메모리 시스템 기반 SWRL과 ATMS의 효율적 결합 연구 (SWAT: A Study on the Efficient Integration of SWRL and ATMS based on a Distributed In-Memory System)

  • 전명중;이완곤;바트셀렘;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제45권2호
    • /
    • pp.113-125
    • /
    • 2018
  • 최근 빅데이터의 시대가 도래하여 다양한 분야로부터 다량의 지식을 얻을 수 있다. 수집된 지식은 정형화된 형태의 지식으로 가공하여 표현되며, 그 중 W3C의 온톨로지 표준 언어인 OWL이 대표적인 정형화 표현 형식이다. 이렇게 표현된 대용량의 온톨로지로부터 내재된 정보를 도출하기 위해 다양한 방법의 심볼릭 추론(Symbolic Reasoning) 연구가 활발하게 진행되고 있다. 그러나 대부분의 추론 연구들은 서술논리(Description Logic)표현 기반의 제한적인 규칙표현을 지원하며 실생활 기반의 서비스를 구축하기에는 많은 제약이 따른다. 또한 잘못된 지식으로부터 도출된 결과는 규칙들 사이의 종속관계에 따라 연쇄적으로 잘못된 지식이 생산될 수 있기 때문에 이러한 잘못된 지식에 대한 처리를 위한 지식관리가 필요하다. 따라서 본 논문에서는 해당 문제를 해결하기 위해 SWRL(Semantic Web Rule Language) 기반의 추론과 ATMS(Assumption-based Truth Maintenance System)간의 결합을 통해 새롭게 도출된 지식에 대한 관리를 할 수 있는 SWAT(SWRL + ATMS) 시스템을 제안한다. 또한 이 시스템은 대용량 데이터를 처리하기 위해 분산 인-메모리 프레임워크 기반의 SWRL추론과 ATMS를 병합 구축하였으며 이를 바탕으로 웹 형태의 ATMS 모니터링 시스템을 통하여 사용자가 손쉽게 잘못된 지식을 검색 및 수정할 수 있도록 한다. 본 논문에서 제안하는 방법에 대한 평가를 위해 LUBM(Lehigh University Benchmark)데이터 셋을 사용하였으며, 대용량 데이터에 대한 SWRL 추론과 잘못 추론된 정보에 대한 삭제를 통해 효율적인 추론과 관리가 가능한 결합 방법임을 증명한다.

컴포넌트 기반의 망관리 시스템 개발에 관한 연구 (A Study on Development of Network Management Systems base on Component)

  • 김행곤;김지영
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.937-950
    • /
    • 2004
  • 인터넷과 웹의 확산으로 네트워크 기반의 분산 환경은 응용의 표준 아키텍처로 인식되고 있다. 또한 네트워크의 효율성과 최상의 서비스 제어와 공유를 위해 복잡한 네트워크 구성 자원들을 관리하는 망 관리 시스템이 요구되고, 이는 응용의 표준 하부 지원 시스템으로서 뿐 아니라 독립적인 상업적 응용으로서 수요와 기대가 점차 증가하고 있다. 하지만 특정 프로토콜이나 특정적인 벤더의 장치에 의존적으로 분산되어져 있고, 이기종의 분산형 네트워크 자체의 성질 때문에 이들 시스템들을 통합하고 일관성 있게 관리할 수 있는 표준화된 망관리의 필요성이 요구되고 있다. 또한 소프트웨어 개발 방법 측면에서는 패턴과 컴포넌트에 의한 조림, 확장을 중심으로 하는 소프트웨어 재사용이 소프트웨어 생산의 기대치를 현실화할 수 있는 최상의 접근 방법으로 인정된다. 이에 따라 잘 정의된 인터페이스를 통해 좀더 쉽고 빠른 응용을 개발 가능하게 하는 컴포넌트 기반 개발 방법론을 기반으로 컴포넌트를 구축, 선택, 조림함으로써 높은 품질과 생산성을 보장한다. 따라서 본 논문에서는 분산 망관리 시스템 개발을 위해 망관리 아키텍처를 정의하고, 망관리 설계패턴과 컴포넌트들을 식별, 정의하여 컴포넌트 아키텍처에 매핑한다. 또한 이를 통해 컴포넌트 개발과 유통, 사용을 위한 컴포넌트를 명세하고, 컴포넌트 설계를 통해 이를 구현하였으며, 구현된 컴포넌트들은 등록, 검색 및 이해할 수 있는 컴포넌트 저장소 시스템으로 적용하고, 미리 구현된 컴포넌트를 통해 전체 망관리 시스템을 분석/설계, 구현하였다.

소셜데이터 분석 및 인공지능 알고리즘 기반 범죄 수사 기법 연구 (Artificial Intelligence Algorithms, Model-Based Social Data Collection and Content Exploration)

  • 안동욱;임춘성
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.23-34
    • /
    • 2019
  • 최근 디지털 플랫폼을 활용한 민생 위협 범죄는 '15년 약 14만여 건, '16년 약 15만여 건 등 사이버범죄 지속 증가 추이이며 전통적인 수사기법을 통한 온라인 범죄 대응에 한계가 있다고 판단되고 있다. 현행 수기 온라인 검색 및 인지 수사 방식만으로는 빠르게 변화하는 민생 위협 범죄에 능동적으로 대처 할 수 없으며, 소셜 미디어 특성상 불특정 다수에게 게시되는 콘텐츠로 이루어 졌다는 점에서 더욱 어려움을 겪고 있다. 본 연구는 민생 침해 범죄가 발생하는 온라인 미디어의 특성을 고려한 콘텐츠 웹 수집 방식 중 사이트 중심의 수집과 Open API를 통한 방식을 제시한다. 또한 불법콘텐츠의 특성상 신속히 게시되고 삭제되며 신조어, 변조어 등이 다양하고 빠르게 생성되기 때문에 수작업 등록을 통한 사전 기반 형태소 분석으로는 빠른 인지가 어려운 상황이다. 이를 해소 하고자 온라인에서 벌어지는 민생 침해 범죄를 게시하는 불법 콘텐츠를 빠르게 인지하고 대응하기 위한 데이터 전처리인 WPM(Word Piece Model)을 통하여 기존의 사전 기반의 형태소 분석에서 토크나이징 방식을 제시한다. 데이터의 분석은 불법 콘텐츠의 수사를 위한 지도학습 기반의 분류 알고리즘 모델을 활용, 투표 기반(Voting) 앙상블 메소드를 통하여 최적의 정확도를 검증하고 있다. 본 연구에서는 민생경제를 침해하는 범죄를 사전에 인지하기 위하여 불법 다단계에 대한 사례를 중심으로 분류 알고리즘 모델을 활용하고, 소셜 데이터의 수집과 콘텐츠 수사에 대하여 효과적으로 대응하기 위한 실증 연구를 제시하고 있다.

  • PDF

아시아 인터넷 공공 도서관(Internet Public Library Asia) 구축에 관한 연구 (Construction of Internet Public Library Asia)

  • 이원숙;일본명;일본명;일본명;일본명
    • 한국비블리아학회지
    • /
    • 제13권2호
    • /
    • pp.59-73
    • /
    • 2002
  • 본 연구에서는, 우선 인터넷의 보급에 의해 변화되어진 전통적인 공공 도서관 서비스를 몇가지의 예를 통하여 조사하였다. 이 과정에서 아시아지역에서 발신되어진 양질의 정보 자원을 아시아어로 소개하는 다언어 서브젝트 게이트웨이의 필요성에 대하여 깨달았다. 그리하여 본 연구에서는 한국어. 일본어, 중국어로 쓰여져 있는 정보 자원중 공공 도서관의 이용자들에서 유용하다고 생각되어지는 자료를 웹으로부터 수집하여, 각각의 정보 자원에 관한 소개를 전술한 3개 언어와 영어로 기술하는 Internet Public Library Asia의 구축을 진행해왔다. 본 시스템에서 사용하는 메타 데이터 스키마는DC(Dublin Core Metadata Element Set)$^{1)}$와 IEEE LOM$^{2)}$을 기본으로 만들어졌고, 다언어 메타 데이터는 각각의 언어를 모국어로 하는 메타 데이터 작성자들에 의하여 협동으로 작성되어졌다. 또 본 시스템에서는 메타 데이터뿐만 아니라 이용자 인터페이스도 다언어로 제공하여 이용자가 언어에 구애받지 않고 검색할 수 있도록 돕고 있다. 메타 데이터의 기술에는 XML을 사용하였고, 기술되어진 메타 데이터는 PostgreSQL를 이용하여 데이터 베이스화 하였다. 다언어 이용자 인터페이스의 실현에는 XSLT등의 기술을 사용하고 있다.

  • PDF