• 제목/요약/키워드: 코드 검색

검색결과 303건 처리시간 0.026초

Web 문서의 효율적인 실시간 검색을 위한 잡음 제거와 패턴 정합 기법 (Noise Removal and Pattern Matching for Efficient Meta-Search of Web Documents)

  • 강대기;이제선;함호상
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.132-134
    • /
    • 1998
  • 웹 상의 메타 검색 엔진, Push 프로그램 그리고 에이전트와 같은 웹 기반 응용 프로그램들은 웹 문서의 취득과 자동 필터링에 대한 능력을 필요로 한다. 이를 위한 인터페이스의 지식들은 대부분 코드 내에서 ad-hoc으로 구현되어 왔다. 본 논문에서는 취득된 웹 문서를 전처리하고 원하는 정보를 추출하기 위한 방법을 제시하고, 웹 상위 신문 기사에 대한 검색으로 실험해 보았다. 검색 시스템은 웹 문서의 전처리 과정을 통해 필요한 정보에만 집중할 수 있고, 아주 적은 양의 일반화된 지식을 토대로 원하는 정보를 용이하게 찾을 수 있었으며, 또한 웹 문서의 형식이 바뀌더라도 크게 영향을 받지 않으며, 새로운 웹사이트의 추가도 용이하였다. 본 논문의 방법으로 구현된 신문 기사 검색 시스템은, URL과 아주 적은 양의 지식만으로도, 10 개의 신문 웹사이트에서 문서를 가져와 효과적으로 해석할 수 있었다. 본 논문의 방법은 메타 검색 엔진이나, 잡지나 신문 기사 정보의 푸쉬(Push) 솔루션, 또는 상품 정보 검색 시스템 등의 설계에 활용될 수 있다.

  • PDF

21세기 세종계획 원시 말뭉치의 유니코드와 코드 변환 (Unicode and Code Conversion for Sejong 21 Raw Corpus)

  • 강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.262-265
    • /
    • 2009
  • 21세기 세종계획은 국어정보화를 위한 범국가적 사업으로서 국어 기초 자원을 구축하는데 매우 큰 기여를 하였으며, 그 주요 결과물로 배포된 세종 말뭉치는 많은 연구자들에게 꼭 필요한 가치있는 결과물이다. 이처럼 소중한 국어 자원을 실제 연구자들이 활용하고자 할 때 불편함을 느끼는 경우가 있는데 그 이유는 균형 말뭉치의 구축이라는 말뭉치의 특성 및 원문 자료의 내용을 최대한 보존하기 위한 노력의 일환으로 사용자 정의 영역에 정의된 문자들이 다수 포함되어 있기 때문이다. 본 논문에서는 자연언어 처리, 정보검색 분야 연구자들이 세종계획 최종 결과물 중에서 원시 말뭉치를 활용하는데 있어서 말뭉치에 사용된 문자코드의 유형을 중심으로 코드 변환 문제점과 그 해결 방안을 모색하고자 한다.

  • PDF

모바일 비주얼 검색: 기술과 표준화 동향 (Technology and Standardization Trend of Mobile Visual Search)

  • 이승재;이근동;나상일;제성관;정다운;오원근;서영호;손욱호
    • 전자통신동향분석
    • /
    • 제29권1호
    • /
    • pp.61-71
    • /
    • 2014
  • 모바일 비주얼 검색(MVS: Mobile Visual Search) 기술은 스마트폰 환경에서 질의 영상의 특징을 검출하고 그 주변 영역의 정보를 이용하여 추출한 서술자를 미리 구축된 영상정보 DB와 비교하여 검색하는 기술로 스마트폰의 보급과 네트워크 환경발달에 따라 응용서비스의 범위와 가능성이 확대되고 있다. 본 동향에서는 기존의 텍스트, 음성, QR코드 등의 검색을 넘어 인간이 보는 그대로를 검색하고자 하는 모바일 비주얼 검색의 기술 및 표준화 동향을 분석하고 향후 전망에 대해서 살펴보고자 한다.

  • PDF

특성 기반 객체지향 시소러스 구축 (Feature Based Object-Oriented Thesaurus Construction)

  • 정대성;한정수;김귀정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1579-1582
    • /
    • 2003
  • 본 연구는 컴포넌트 검색을 위해서 컴포넌트를 컨덱스트에 의해 패싯 분류하고, 컨텍스트와 특성들간의 관련값에 대한 통계적 분석에 의해 시소러스를 구축하여 다중 패싯 분류된 컴포넌트를 효율적으로 검색할 수 있는 방법을 제안하였다. 소스 코드로부터 추출된 특성은 카이제곱 방법을 통하여 간소화가 이루어지며, E-SARM 방법을 사용하여 컨텍스트의 자동 검색이 이루어질 수 있도록 하였다. 쿼리에 대해 자동 검색된 컨덱스트에 의해 후보 컴포넌트가 선정되고, 쿼리와 컴포넌트 간의 유사도가 계산됨으로써 컴포넌트가 검색될 수 있도록 하였다. 본 연구는 다중 패싯 분류된 컴포넌트의 검색에 효율적이며, 컴포넌트의 재사용성을 높일 수 있도록 하였다.

  • PDF

아날로지를 기반으로 한 객체모델의 재사용 (Analogy-based Reuse of Object Model)

  • 배제민
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.665-674
    • /
    • 2007
  • 소스 코드 재사용은 다른 개발자에 의해 만들어진 코드를 정확하게 이해하거나 검색하기 어렵다는 점에서 몇 가지 제한점을 갖는다. 이러한 문제점을 해결하기 위해서 소스코드 자체보다는 분석 및 설계 정보를 재사용하는 것이 가능해야 한다. 이에 본 논문은 객체 모델 및 패턴을 재사용하기 위해 필요한 analogical 매칭 기법을 제안한다. 그리고_ 객체 모델과 디자인 패턴을 재사용 컴포넌트로서 저장할 수 있도록 표현하는 방법을 제안한다. 즉, 재사용 라이브러리에 저장된 유사 컴포넌트를 검색하는 analogical 매칭 함수와 매칭을 지원할 수 있는 라이브러리 구조 및 재사용 컴포넌트의 라이브러리내 표현 방법에 대해 기술하였다.

정보코드 결합을 이용한 음원분류 시스템 구현 (Implementation of Music Source Classification System by Embedding Information Code)

  • 조재영;김윤호
    • 한국항행학회논문지
    • /
    • 제10권3호
    • /
    • pp.250-255
    • /
    • 2006
  • 디지털 멀티미디어 사회에서 음원은 과거 아날로그 방식에서 탈피하여 디지털 방식으로 생성, 저장 및 전송되는 음악 시스템이 주류를 이룬다. 이 과정에서 특정 규약에 따라 음악의 각종 정보를 위한 디지털 코드를 삽입해 놓는다면 음원분류 시스템이 내장된 Mp3 플레이어나 기타 디지털 음원 재생기에서 특정 곡의 선택, 분류등 여러 기능을 효율적으로 수행 할 수 있다. 본 논문에서는 기존의 음원에 정보 코드를 삽입하여 특정 재생기에서 개인이 원하는 방식으로 음악을 분류 및 검색할 수 있는 음원 분류 시스템을 구현하였다. 구현된 시스템을 이용하여 임의 장르에 대한 선별적 분류, 검색 실험 결과 제안한 방법의 타당성을 입증하였다.

  • PDF

소프트웨어 재공학과 유지보수 지원을 위한 툴의 개발 (Development of the Tool for Software Re-engineering and Maintenance)

  • 김행곤;황선명
    • 한국정보처리학회논문지
    • /
    • 제1권3호
    • /
    • pp.299-310
    • /
    • 1994
  • 소프트웨어 재공학 툴은 소프트웨어 유지보수 생산성과 그작업의 품질 향상에 기 여한다. 재공학은 프로그램의 구성요소에 대한 기능 변경이 아닌 행위 변경(객체의 이 름과 정의, 재구성프로세스 논리)을 일반적으로 관리한다. 본 논문은 객체 지향 프로 그램언어(C++)로 작성된 원시 코드의 유지 보수를 위한 소프트웨어 재공학 툴인 InMaC++(Interactive Maintenance for C++)의 개발에 대해 서술한다. InMaC++ 는 원시 코드와 다이어그램(설계정보) 형태 모두를 표현할 수 있고 편집 기능이 가능 하며 원시 코드에서 다이어그램으로 다이어그램에서 원시 코드로의 변형이 가능하다. 따라서 이들 변형을 통해 기존 코드의 유지보수와 재공학이 가능하다. 특히 시스템의 검색기능은 그래픽 인터페이스로 구현되었으며 InMaC++는 객체 지향 프로그램의 메 소트, 속성, 클래스등의 구성 요소를 기반한 데이터베이스를 포함 하고 있으며, 이 모 델은 구현과 사용의 편리성과 툴의 구성을 용이하게 하기 위해 4가지의 객체 클래스와 3가지 관계를 정의하고 이들 객체 클래스의 검색을 위해 시스템 제공 단순 질의어가 제공한다.

  • PDF

저전송율 보코더의 성능개선에 관한 연구 (On an Improving Performance of Low Bit-Rate Speech Coder)

  • 박영호;홍성훈;배명진
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.101-107
    • /
    • 1998
  • 본 논문에서는 잔차신호를 모델링하기 위해 사용되는 동적희박대수코드북에 대해 분석하고 성능이 향상된 새로운 대수코드북 구조 및 검색과정을 제안하였다. 제안된 알고리 즘은 대수 코드북의 단점을 계산량의 증가 없이 개선시켰다. 먼저 기존에 단순히 부호비트 만을 검색하는 것에 대해 다양한 펄스 진폭의 선택을 가능하게 하였다. 그리고 동일 트랙상 에서 두 펄스를 선택하게 하였으며 추가 계산량이 필요없는 무성음에서 유성음으로의 천이 구간 검출기를 이용하여 LSF 보간 시 발생하는 천이구간에서의 LP지연을 최소화하였다. 제 안된 알고리즘을 이용한 5.6kbps음성부호화기는 전화선상의 음질을 시료로 하여 주관적 음 질면에서 6.3kbps MP-MLQ와 동등하였으며 MNRU Q=15dB에서는 MP-MLQ에 비해 약간 의 음질열하가 발생하였다.

  • PDF

특허분석을 통한 신기술의 잠재 산업 발굴 -핵융합 실증로 기획을 중심으로 (Analyzing Patent Information to Identify Industrial Potential of New Technology : A Case Study of Fusion DEMO)

  • 장한수;황성하;김유빈
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2015년도 추계학술대회 논문집
    • /
    • pp.206-211
    • /
    • 2015
  • 신규 기술 기획시 해당 기술의 파급효과 중 하나로 관련 산업에 미치는 영향에 대하여 강조하는 추세이다. 그러나 시장이 형성되지 않는 제품에 대해서는 이러한 파급효과 추정이 용이하지 않다. 본 논문은 특허분석을 통하여 시장 현황 파악이 어려운 신규기술의 기획시 잠재 산업을 발굴하는 방법론을 제시하고 실증사례로 핵융합 실증로에 적용하고자 한다. 특허 분석 방법론은 특허 검색 범위에 따라 파악 가능한 잠재산업의 수준을 검토한다. 적정한 특허 검색 범위가 확인되면, 특허분석을 수행한다. 분석결과는 IPC 코드 등 특허의 산업 코드, 개별기업의 매출, 주제어 등을 활용하여 잠재산업을 발굴하는 방법을 제시한다. 이러한 방법론은 이미 기획된 핵융합 실증로에 적용하여 유용성을 검토한다,

  • PDF

소스코드 재사용을 위한 효율적인 의미망 구성에 관한 연구 (A Study on Efficient Construction of Sementic Net for Source Code Reuse)

  • 김귀정
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.475-479
    • /
    • 2005
  • 본 연구에서는 객체 지향 소스 코드의 검색과 재사용을 효율적으로 수행할 수 있는 의미망을 구축하였다. 이를 위하여 각 노드 간 객체지향 상속의 개념을 표현할 수 있도록 의미망의 초기 관련값을 시소러스로 구축하였다. 또한, 의미망의 노드와 간선을 활성화시키고 활성값을 전파 시키기 위해 사용되는 spreading activation 방법의 단점을 보완하여 spreading activation의 성능은 최대한 유지하면서 검색 속도를 향상 시킬 수 있는 방법을 제안하였다.

  • PDF