• 제목/요약/키워드: Retrieval systems

검색결과 1,016건 처리시간 0.025초

나이브베이즈 분류모델과 협업필터링 기반 지능형 학술논문 추천시스템 연구 (A Study of Intelligent Recommendation System based on Naive Bayes Text Classification and Collaborative Filtering)

  • 이상기;이병섭;박병용;황혜경
    • 정보관리연구
    • /
    • 제41권4호
    • /
    • pp.227-249
    • /
    • 2010
  • 정보기술과 인터넷의 발달로 학술정보가 폭발적으로 증가하고 있다. 정보 과잉으로 인해 연구자들은 필요한 정보를 찾거나 필터링하는데 더 많은 시간과 노력을 투입하고 있다. 이용자들이 원하는 정보를 예측하여 관심 가질만한 정보를 선별하여 추천하는 시스템을 전문가시스템, 데이터마이닝, 정보검색 등 다양한 분야에서 오래 전부터 연구하여 왔다. 최근에는 콘텐츠기반추천시스템과 협업필터링을 결합하거나 다른 분야 모델을 접목한 하이브리드 추천시스템으로 발전하고 있다. 본 연구에서는 기존 추천시스템 문제를 해결하고 대규모 정보센터나 도서관에서 학술논문을 효율적이고 지능적으로 추천하기 위해 협업필터링과 나이브베이즈모델을 결합한 새로운 방식의 추천시스템을 제시하였다. 즉, 협업필터링 방식으로 과도한 특성화(Over-specialization) 문제를 해결하고, 나이브베이즈모델을 통해 평가정보나 이용정보가 부족한 신규콘텐츠 추천문제를 해소하였다. 본 모델을 검증하기 위해 한국과학기술정보연구원 NDSL에서 제공하는 식품과 전기 분야 학술논문에 적용하여 실험하였다. 현재 NDSL 이용자 4명에게 피드백을 받은 결과 추천논문에 상당히 만족하는 것으로 나타났다.

표준 기록관리시스템 검색 기능 평가 (Evaluation of Search Functions of the Standard Records Management Systems)

  • 이경남
    • 기록학연구
    • /
    • 제37호
    • /
    • pp.273-305
    • /
    • 2013
  • 현재의 전자기록관리체계에서 기록정보를 적극적으로 활용하기 위해서는 시스템이 기록의 이용을 충분히 지원하도록 설계되고 활용되고 있는가를 평가할 필요가 있다. 이 연구에서는 공공기관에서 사용하고 있는 표준 기록관리시스템의 검색 기능 활용 현황 분석 및 기능 평가를 수행하였다. 검색 기능 활용 현황 조사를 위해 표준 기록관리시스템을 사용하는 공공기관의 기록관리 전문요원을 대상으로 설문조사를 실시하였으며, 그 결과 표준 기록관리시스템의 검색 빈도가 낮지 않음에도 불구하고 이용자의 사용 편의에 대한 불만과 검색 성능에 대해 불만족하고 있음이 드러났다. 검색 기능 평가를 위해 먼저, 기록관리시스템으로서 갖추어야 하는 기본적인 기능요건을 정의하여 평가를 위한 체크리스트를 개발하였다. 체크리스트를 평가 기준으로 활용하여 평가를 실시하였으며, 평가는 크게 두 가지로 진행되었다. 첫 번째는 체크리스트와 비교하여 현재 표준 기록관리시스템이 구현한 정도를 문서상으로 확인한 연구자의 체크리스트 사전 점검 평가와 두 번째, 표준 기록관리시스템을 사용하고 있는 공공기관의 기록관리 전문요원을 대상으로 평가를 실시하였다. 기능 평가를 실시한 결과 기본적인 기능요건임에도 불구하고 구현되지 않은 기능들에 대한 보완이 요구되었고, 특히 이용자 편의성 관련한 기능개선이 필요하였다. 이러한 과정에서 도출된 검색 기능에 대한 기능개선 뿐만 아니라 표준 기록관리시스템의 발전을 위해서는 지속적인 유지보수와 관리 체계의 구축, 이용자 교육이 필요함을 논의하였다.

효율적 공간 형상화 및 건물성능분석을 위한 스케치 정보 기반 BIM 모델 자동생성 프레임워크 개발 (A Framework Development for Sketched Data-Driven Building Information Model Creation to Support Efficient Space Configuration and Building Performance Analysis)

  • 공병찬;정운성
    • 한국건설관리학회논문집
    • /
    • 제25권1호
    • /
    • pp.50-61
    • /
    • 2024
  • 사용자의 공간 요구사항 중심의 평면계획에 대한 수요가 증가함에 따라 소형 주택시장이 지속적으로 성장하고 있다. 하지만 건축주는 공간 구성이나 비용 견적과 같은 근거를 기반으로 평면요구사항을 개진하는데 매우 제한적인 수단을 활용하고 있어 건축가와 같은 전문가들과의 소통에 많은 어려움을 겪고 있다. 본 연구의 목적은 스케치 정보 기반의 공간 요구사항을 BIM 모델의 3D 건물구성요소로 자동 변환하여 사용자의 공간에 대한 이해를 돕고, 초기 설계단계에서 예산 산정을 지원하기 위한 건물성능분석 정보를 제공할 수 있는 프레임워크 개발에 있다. 본 연구의 방법론은 프로세스 모델 개발, 프레임워크 구현 및 검증단계로 구성되었다. 프로세스 모델 개발은 프레임워크의 데이터 흐름을 묘사하고 프레임워크에 필요한 기능을 정의하는 단계이며, 프레임워크 구현은 프로세스 모델을 기반으로 시스템 인터페이스와 사용자 인터페이스를 개발하고, 이종 시스템 간의 연동 방식을 정의하는 단계이다. 검증단계는 개발된 프레임워크가 스케치 정보로 표현된 공간 요구사항을 BIM 모델의 벽, 바닥, 지붕과 같은 건물 구성요소 객체들로 자동 변환할 수 있는가를 검증하였다. 또한 프레임워크가 BIM 모델을 기반으로 재료 및 에너지 비용을 자동으로 산출할 수 있는가를 검증하였다. 프레임워크를 통해 사용자는 스케치 정보를 기반으로 3D 건물 구성요소를 효율적으로 생성할 수 있으며, 생성된 BIM 모델을 통해 공간을 이해하고 건물성능분석 정보를 제공받을 수 있다.

온라인 리뷰 환경에서의 디지털 넛지: 사진을 먼저 업로드 하는 행동이 리뷰의 품질에 미치는 영향 (Digital Nudge in an Online Review Environment: How Uploading Pictures First Affects the Quality of Reviews)

  • 이재민;김태영;이호근
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.1-26
    • /
    • 2023
  • 소비자들은 판매자가 제공하는 정보 보다는 다른 소비자가 제공하는 정보를 더욱 신뢰하는 경향이 있다. 그렇기 때문에 소비자로 하여금 높은 품질의 리뷰를 작성하도록 유도하는 것은 기업에게 있어서 매우 중요한 과제지만, 이처럼 양질의 리뷰를 생산하게 만드는 것은 쉽지 않다. 그래서 우리는 리뷰 작성 및 기억 회상 관련 연구를 토대로 소비자들이 자연스럽게 높은 품질의 리뷰를 작성하도록 만드는 디지털 넛지(digital nudge) 방법을 개발하기로 결정했다. 구체적으로, 우리는 온라인 리뷰 작성 과정에서 리뷰 작성자의 사진을 먼저 업로드 하는 행동이 리뷰의 품질에 미치는 영향을 검증하는 실험을 설계하였다. 이를 위해 우리는 실험 대상자를 모집 후, 리뷰 작성 전에 사진을 먼저 업로드 하는 그룹과 그렇지 않는 그룹으로 나누었다. 그리고 각 실험 대상자들에게 긍정 리뷰와 부정 리뷰를 작성하게 하는 과제를 할당하였다. 그 결과, 사진을 먼저 업로드 하는 행동이 리뷰 내용의 길이를 늘린다는 점을 확인하였다. 또한 사진을 먼저 업로드 하는 온라인 유저들이 그 상품에 대한 만족도가 극단적으로 부정적일 때, 그 유저가 작성하는 리뷰 내용의 양면성의 정도가 증가한다는 것을 확인하였다.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

RFM 다차원 분석 기법을 활용한 암시적 사용자 피드백 기반 협업 필터링 개선 연구 (A Study on Improvement of Collaborative Filtering Based on Implicit User Feedback Using RFM Multidimensional Analysis)

  • 이재성;김재영;강병욱
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.139-161
    • /
    • 2019
  • 전자상거래 시장의 이용이 보편화 되며 고객들에게 좋은 품질의 물건을 어디서, 얼마나 합리적으로 구매할 수 있는지가 중요해졌다. 이러한 구매 심리의 변화는 방대한 정보 속에서 오히려 고객들의 구매 의사결정을 어렵게 만드는 경향이 있다. 이때 추천 시스템은 고객의 구매 행동을 분석하여 정보 검색에 드는 비용을 줄이고 만족도를 높이는 효과가 있다. 하지만 대부분 추천 시스템은 책이나 영화 등 동종 상품 분류 내에서만 추천이 이뤄진다. 왜냐하면 추천 시스템은 특정 상품에 매긴 구매 평점 데이터를 기반으로 해당 상품 분류 내 유사한 상품에 대한 구매 만족도를 추정하기 때문이다. 그밖에 추천 시스템에서 사용하는 구매 평점의 신뢰성에 대한 문제도 제시되고 있으며 오프라인에선 평점 확보 자체가 어렵다. 이에 본 연구에서는 일련의 문제를 개선하기 위해 RFM 다차원 분석 기법을 활용하여 기존에 사용하던 고객의 구매 평점을 객관적으로 대체할 수 있는 새로운 지표의 활용 가능성을 제안하는 바이다. 실제 기업의 구매 이력 데이터에 해당 지표를 적용해서 검증해본 결과 높게는 약 55%에 해당하는 정확도를 기록했다. 이는 총 4,386종에 달하는 이종 상품들 중 한번도 이용해 본 적 없는 상품을 추천한 결과이기 때문에 검증 결과는 상대적으로 높은 정확도와 활용가치를 의미한다. 그리고 본 연구는 오프라인의 다양한 상품데이터에서도 적용할 수 있는 범용적인 추천 시스템의 가능성을 시사한다. 향후 추가적인 데이터를 확보한다면 제안하는 추천 시스템의 정확도 향상도 기대할 수 있다.

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.

엔터프라이즈 환경의 연구비 통합관리 데이터 웨어하우스 개발 프로세스 (Integrated Management Data Warehouse Development Process of Research Expenses in Enterprise Environment)

  • 최성만;유철중;장옥배
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.183-194
    • /
    • 2004
  • 기존의 연구비 관리업무는 예산계획, 예산편성 및 예산정산 부분으로 관리됨으로써 여러 가지 문제점이 발생되었다. 이러한 문제점을 해결하고 연구비의 안정적인 확보와 효율적인 운영 및 투명한 집행을 위하여 연구비의 통합관리가 절실하게 요구되고있는 실정이다. 최근의 이러한 추세를 반영하여 기존의 시스템 통합업체(Inmon, IBM)의 데이터 웨어하우스 개발 프로세스에 대해서 연구한 결과 Inmon의 데이터 웨어하우스 개발 프로세스에서는 고전적인 개발주기 기법으로 단계적이며 순차적인 접근방법을 이용한다. 이로 인해 개발단계에서 중복되어지는 부분이 나타나게 되어 각 단계의 진행과정에서 그 이전단계로 피드백이 요청되는 심각한 문제를 유발하게 된다. 또한, IBM의 데이터 웨어하우스 개발 프로세스에서는 개발 프로세스가 수행되는 동안 기능과 데이터가 분리되어 어떤 기능이 데이터를 참조하고 수정하는지 안기 어려운 문제점이 발생되었다. 따라서, 된 논문에서는 이러한 문제점들을 해결하고자 계획 덴 분석단계, 설계단계, 구현 및 시험단계에서 UML을 적용한 엔터프라이즈 환경의 연구비 통합관리 데이터 웨어하우스 개발 프로세스를 제안하였다. 본 논문에서는 기존의 예산계획 DB, 예산편성 DB, 예산정산 DB의 데이터를 이용하여 사용자가 인하는 정보를 찾아주는 역할을 정보검색 에이전트에서 수행한다. 또한, 정보통합 에이전트에서는 정보검색 에이전트에서 수집한 데이터를 추출, 전송, 가공, 로딩 하여 통합 데이터베이스에 저장한다. 결과적으로, 정보통합 에이전트에서는 다수의 정보소스를 사용자가 하나하나 접근하여 검사하는 노력을 줄여주고 사용자에게 불필요하다고 판단되는 데이터를 걸러주는 역할을 수행한다. 이러한 결과로 사용자의 요구사항을 최대한 반영하여 연구비 관리정책의 수립에 필요한 다양한 형태의 의사결정 지원정보를 제공할 수 있도록 하였다. 최종 사용자에게는 원하는 분석정보를 신속하게 접근하여 단편적인 관점보다는 종합적인 관점에서 다양한 분석자료를 제공받을 수 있도록 하였다. 또한, 3개의 시스템을 하나로 통합한 결과 데이터의 공유, 시스템 통합, 운영비용 절감, 의사결정 지원환경을 단순화시키는 효과를 제공하였다.

THE CURRENT STATUS OF BIOMEDICAL ENGINEERING IN THE USA

  • Webster, John G.
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1992년도 춘계학술대회
    • /
    • pp.27-47
    • /
    • 1992
  • Engineers have developed new instruments that aid in diagnosis and therapy Ultrasonic imaging has provided a nondamaging method of imaging internal organs. A complex transducer emits ultrasonic waves at many angles and reconstructs a map of internal anatomy and also velocities of blood in vessels. Fast computed tomography permits reconstruction of the 3-dimensional anatomy and perfusion of the heart at 20-Hz rates. Positron emission tomography uses certain isotopes that produce positrons that react with electrons to simultaneously emit two gamma rays in opposite directions. It locates the region of origin by using a ring of discrete scintillation detectors, each in electronic coincidence with an opposing detector. In magnetic resonance imaging, the patient is placed in a very strong magnetic field. The precessing of the hydrogen atoms is perturbed by an interrogating field to yield two-dimensional images of soft tissue having exceptional clarity. As an alternative to radiology image processing, film archiving, and retrieval, picture archiving and communication systems (PACS) are being implemented. Images from computed radiography, magnetic resonance imaging (MRI), nuclear medicine, and ultrasound are digitized, transmitted, and stored in computers for retrieval at distributed work stations. In electrical impedance tomography, electrodes are placed around the thorax. 50-kHz current is injected between two electrodes and voltages are measured on all other electrodes. A computer processes the data to yield an image of the resistivity of a 2-dimensional slice of the thorax. During fetal monitoring, a corkscrew electrode is screwed into the fetal scalp to measure the fetal electrocardiogram. Correlations with uterine contractions yield information on the status of the fetus during delivery To measure cardiac output by thermodilution, cold saline is injected into the right atrium. A thermistor in the right pulmonary artery yields temperature measurements, from which we can calculate cardiac output. In impedance cardiography, we measure the changes in electrical impedance as the heart ejects blood into the arteries. Motion artifacts are large, so signal averaging is useful during monitoring. An intraarterial blood gas monitoring system permits monitoring in real time. Light is sent down optical fibers inserted into the radial artery, where it is absorbed by dyes, which reemit the light at a different wavelength. The emitted light travels up optical fibers where an external instrument determines O2, CO2, and pH. Therapeutic devices include the electrosurgical unit. A high-frequency electric arc is drawn between the knife and the tissue. The arc cuts and the heat coagulates, thus preventing blood loss. Hyperthermia has demonstrated antitumor effects in patients in whom all conventional modes of therapy have failed. Methods of raising tumor temperature include focused ultrasound, radio-frequency power through needles, or microwaves. When the heart stops pumping, we use the defibrillator to restore normal pumping. A brief, high-current pulse through the heart synchronizes all cardiac fibers to restore normal rhythm. When the cardiac rhythm is too slow, we implant the cardiac pacemaker. An electrode within the heart stimulates the cardiac muscle to contract at the normal rate. When the cardiac valves are narrowed or leak, we implant an artificial valve. Silicone rubber and Teflon are used for biocompatibility. Artificial hearts powered by pneumatic hoses have been implanted in humans. However, the quality of life gradually degrades, and death ensues. When kidney stones develop, lithotripsy is used. A spark creates a pressure wave, which is focused on the stone and fragments it. The pieces pass out normally. When kidneys fail, the blood is cleansed during hemodialysis. Urea passes through a porous membrane to a dialysate bath to lower its concentration in the blood. The blind are able to read by scanning the Optacon with their fingertips. A camera scans letters and converts them to an array of vibrating pins. The deaf are able to hear using a cochlear implant. A microphone detects sound and divides it into frequency bands. 22 electrodes within the cochlea stimulate the acoustic the acoustic nerve to provide sound patterns. For those who have lost muscle function in the limbs, researchers are implanting electrodes to stimulate the muscle. Sensors in the legs and arms feed back signals to a computer that coordinates the stimulators to provide limb motion. For those with high spinal cord injury, a puff and sip switch can control a computer and permit the disabled person operate the computer and communicate with the outside world.

  • PDF

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.