• Title/Summary/Keyword: target text

검색결과 236건 처리시간 0.028초

의료 정보 추출을 위한 TF-IDF 기반의 연관규칙 분석 시스템 (TF-IDF Based Association Rule Analysis System for Medical Data)

  • 박호식;이민수;황성진;오상윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.145-154
    • /
    • 2016
  • u-Health에 대한 관심과 IT 기술의 발전에 따라 의료 정보를 적극적으로 활용하고자 하는 요구가 커지고 있으며, 이에 대해 텍스트 형태의 의료 정보 데이터에 연관규칙 기법을 적용하여 질병과 증상과의 관계를 추론하는 시스템에 대한 연구들이 이루어지고 있다. 그러나 일반적인 연관규칙 기법을 의료 정보 데이터에 그대로 적용할 경우, 이전에는 새로운 연관규칙들보다 일반적이며 의미없는 연관규칙들이 많이 생성되는 문제가 발생한다. 또한 필터링으로 인해 빈번하게 함께 발생하지는 않지만 의학적으로 의미있는 항목들의 연관 규칙을 발견할 수 없다는 한계점을 가지게 된다. 본 논문에서는 의료데이터 특성을 고려하여 빈번한 항목과 빈번하지 않지만 의학적으로 의미 있는 항목들을 대상으로 연관규칙을 구성하여 의료 전문가의 의사 결정에 도움을 주기 위한 시스템을 제안한다. 제안 시스템은 의료 기록 데이터에서 용어들을 TF-IDF기반으로 가중치를 부여하고 기존 FP-Growth 알고리즘을 확장하여 TF-IDF 가중치를 고려한 빈번하게 발생하거나 빈번하지 않지만 의미 있는 연관규칙을 구성한다. 특정 질의 데이터가 입력되면 해당 데이터에 나타난 연관 규칙들의 유사도를 의학분야 온톨로지를 이용하여 평가하여 해당 데이터의 내용과 관련된 후보 질병들을 추론한다. 추론된 후보 질병명은 의료 전문가에게 의사 결정의 참고 자료로 제공된다. 실제 임상 진료 및 처방 기록 데이터에 대해 제안 시스템을 적용해 본 결과, 본 제안 시스템을 통해 도출한 연관 규칙이 기존 FP-Growth 알고리즘을 적용했을 때 보다 더 구체적인 질병과 증상과의 관계들을 포함함을 확인할 수 있었다. 또한 본 제안 시스템은 자유형식의 의료 및 병리데이터를 마이닝하고 후보 질병들을 가중치 기반으로 보여주므로, 의료 기록 정보로부터 질병 관련 새로운 정보를 획득하고 의료진의 의사 결정에 도움을 주는 시스템으로 활용될 수 있다.

ATSC 3.0 기반 재난약자 맞춤형 재난방송서비스에 대한 연구 (A Study on Optimized Disaster Broadcasting Service for Vulnerable Populations based on ATSC 3.0 Standards)

  • 김나연;현은희;배병준
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.928-938
    • /
    • 2019
  • 현재 우리나라는 북미의 차세대 방송 표준인 ATSC 3.0을 기반으로 국내 지상파 UHD 방송 표준을 제정하고 상용 서비스를 제공하고 있으며, ATSC 3.0에 정의된 재난경보전달을 위한 AEA 시스템 재난방송기술을 이용해 2018년부터 지상파 UHDTV 방송망을 활용한 재난경보방송서비스에 관한 연구를 진행하고 있다. ATSC 3.0이 기존에 단순 푸쉬 형태의 텍스트 메시지 전송에 그치던 재난방송 서비스를 양방향성과 리치미디어의 전송 메카니즘을 도입함으로써 진보된 재난방송 서비스로 확장할 수 있는 표준을 마련하였지만 아직 재난 정보 전달은 여전히 일반 대중들을 중심으로 한 내용이 대부분으로, 구체적인 재난약자를 위한 재난 정보 전달 및 대응책은 미흡한 실정이다. 이에 본 논문에서는 재난방송서비스 수신 대상으로서의 재난약자를 정의하여 ATSC 3.0 기반 재난약자 맞춤형 재난방송서비스를 제시하고, 서비스 제공을 위해서 필요한 재난방송메시지 확장 엘리먼트를 정의한다. 제안하는 재난약자 맞춤형 서비스는 재난약자들을 대상으로 하는 재난 정보 전달 가능성을 높이고 재난 상황에 대한 대처를 유도할 수 있는 보조적인 수단이 될 수 있다. 또한, 기존 재난경보알림 및 재난대응 연구들과 연계를 통해 재난약자를 위한 다양하고 실효성 있는 응용서비스 개발의 기초 연구로 활용될 것으로 예상된다.

화학 데이타베이스에서 부분구조 검색을 위한 인덱스 구조 (An Index Structure for Substructure Searching In Chemical Databases)

  • 이환구;차재혁
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.641-649
    • /
    • 2004
  • 약물의 화학적 구조와 그 약물의 약리작용간의 연관성은, 'Medicinal Chemistry' 분야에서 활발히 연구된다. 이는 화학구조를 기반으로 하여 신약을 설계하려는 시도로서, 약학자는 신약 개발 시 만들고자 하는 약물과 비슷한 화학구조를 가지고 있는 기존 약물들에는 어떠한 것들이 있는지 조사하며, 특정 화학구조가 어떤 약물들에서 나타나는지 신속히 검색하기를 원한다. 이처럼 어떤 화차구조에서, 특정한 부분구조가 존재하는지를 검사하는 것을 부분구조검색(Substructure Searching)이라 하며, 이는 그래프 이론에서 NP-complete인 동형성 판정(Subgraph Isomorphism) 문제로 귀결된다. 검색 시간을 단축시키고자 여러 다른 전근방법들이 연구되었는데, 1990년대에는 구조에 대한 인덱스를 미리 만들어 RDBMS에 저장한 후, 검색시 이론 이용하여 성능을 높이는 방법으로 미국 특허를 획득한 RS3 시스템(http://www.acelrys.com/rs3)이 현재 상용화되어 쓰이고 있다. 본 논문에서는 RS3 시스템의 문제점을 규명하고, 이의 개선방안으로서 새로운 인덱스를 제안한다 RS3 시스템은 각 원자를 중심으로 다른 원자와의 구조를 문자연로 표현하고, 부분구조검색 쿼리를 부분문자열 검색을 실행함으로써 수행하는데, 이의 화학구조를 기술하는 인덱스에는 동일 원자, 동릴 결합에 대한 정렬이 불가능하여 재현율(Recall)과 정도(Precision)가 낮다. 이론 개선하기 위하여 본 논문에서는 2차원의 화학구조를 나누어 1차원의 구조 단편으로 만들고 이를 문자열로 기술하는 방안을 제시하며 구체적인 방법으로 한 인자를 중심으로 최소비용신장트리를 구성한 다음 레벨별로 경로를 나누어 기술하는 방안을 제안하며, 이와 같은 방법의 새로운 인덱스로 재현율과 정도가 급격히 향상됨을 보인다.

트레이스 백 정보에 기반한 매크로 공격 탐지 모델 (A Macro Attacks Detection Model Based on Trace Back Information)

  • 백용진;홍석원;박재흥;강경원;김상복
    • 융합보안논문지
    • /
    • 제18권5_1호
    • /
    • pp.113-120
    • /
    • 2018
  • 오늘날 정보 통신 기술의 발전은 네트워크 기반의 서비스 사용자 수를 빠르게 증가시키고 있으며, 인터넷 상에서 사용자 상호간 실시간 정보 공유를 가능하도록 한다. 정보의 공유 과정에는 다양한 방법들이 존재하지만 일반적으로 포털서비스 기반의 정보 공유가 대중화 되어있다. 그렇지만 이러한 정보 공유 과정은 특정 이해 당사자 상호간 해당 정보의 사회적 관심도 증폭을 위한 불법 행위를 유발시키는 원인이 되고 있다. 그 중 매크로 기능을 이용한 여론 조작 공격은 정상적인 여론의 방향을 왜곡시키기 때문에 이에 대한 보안 대책이 시급한 실정이다. 일반적으로 매크로 공격이란 불법적인 사용자들이 다수의 IP나 아이디를 확보한 후 특정 웹 페이지의 내용에 대하여 여론을 조작하는 공격으로 정의한다. 본 논문은 특정 사용자의 매크로 공격에 대하여 트레이스 백 기반의 네트워크 경로 정보를 분석한 후 해당 사용자의 다중 접속을 탐지할 수 있도록 하였다. 즉, 특정 웹 페이지에 대한 전체적인 접근 경로 정보와 사용자 정보가 일치하는 접근이 2회 이상 발생하면 이를 매크로 공격으로 판정하였다. 또한 동일한 지역에서 특정 웹 페이지에 대하여 다수의 아이디를 이용한 접근이 발생하는 경우, 이에 대한 임계 카운트 값 분석을 통하여 특정 웹 페이지에 대한 전체적인 여론 결과를 왜곡 할 수 없도록 하였다.

  • PDF

파일 단위 공간데이터 변경 인식 데이터 운영 기법 (Operation Technique of Spatial Data Change Recognition Data per File)

  • 이봉준
    • 한국지리정보학회지
    • /
    • 제24권4호
    • /
    • pp.184-193
    • /
    • 2021
  • 공간 데이터를 관리하는 시스템은 저장된 정보의 갱신을 위하여 신규 입수되는 공간정보 파일에 대하여 기존 정보와 달라진 정보만을 추출하여 기존 정보를 갱신 한다. 기존 정보와 달라진 객체만을 추출하기 위해서는 신규 입수된 공간 정보 파일 내에 포함된 모든 객체에 대하여 기존 정보와 달라진 부분이 있는지 비교하게 된다. 수시로 갱신되는 공간 정보의 양이 증가하고 전국 단위의 데이터 갱신이 요구되는 상황에서 이러한 전수 검사 방식을 개선 하고자 본 연구가 진행 되었다. 본 연구에서는 신규 입수 공간 정보 파일내의 개별 객체를 검사하기 이전에, 파일의 정보만으로 개별 공간 객체가 변경 되었는지 여부를 판단할 수 있는 방법에 대하여 고찰해 보았다. 공간 데이터 파일은 일반적인 이미지나 텍스트 문서 파일과는 다른 정형화된 데이터 특성을 가지므로 기존의 파일 hash를 생성하여 관리하는 방식과 비교하여 좀 더 단순한 방식으로 이와 같은 파일단위 변경여부 판단이 가능하다. 전수 검사가 필요한 대상 파일의 숫자를 줄임으로써 전체적인 데이터 품질 검사 시간과 변경 데이터 추출 시간을 절약하여 시스템의 리소스 사용을 개선할 것으로 기대한다.

학술논문 내에서 참고문헌 정보가 포함된 서지 메타데이터 자동 생성 연구 (Automatic Generation of Bibliographic Metadata with Reference Information for Academic Journals)

  • 정선기;신현호;지선영;최성필
    • 한국문헌정보학회지
    • /
    • 제56권3호
    • /
    • pp.241-264
    • /
    • 2022
  • 서지정보는 연구 주제의 최신 동향의 인지와 유용성을 검증하는 데에 참고할 수 있다. 즉, 각자 연구자들이 필요로 하는 문헌에 신속하게 접근하기 위해서는 학술논문에서 저자 정보, 요약, 초록, 참고문헌 등을 쉬운 방법으로 파악해야 한다. 그러나, 현재 출판되는 PDF 형식의 전자 학술논문은 출판 주체별로 고유한 양식을 띄고 있어서, 몇몇 특징에 의한 규칙 기반 추출법으로는 수많은 문헌에서 목표 정보를 추출하여 요약된 서지사항으로 자동 생성하기 어렵다. 이에 본 연구는 학술논문 서지사항 자동 생성에 있어서 양식의 다양성으로 인한 메타데이터 자동 추출의 난점을 극복할 방법을 제안한다. 제안하는 모델은 서지사항이 주로 기술되는 학술논문의 첫 페이지에서 목표 영역과 본문의 시작점을 구분할 수 있는 심층신경망 기반 모델과 앞의 모델로 추출된 서지사항을 상세한 메타데이터로 분류하고 재생성하는 규칙 기반 모델로 구성된다. 제안하는 모델은 참고문헌 요약정보를 생성하는 모델도 포함하는데, 본문의 말미와 참고문헌 시작점의 분리, 그리고 개별 참고문헌 추출을 규칙 기반 방법으로 진행하고, 추출한 각개 참고문헌의 서지정보를 분류하는 데에 심층신경망을 이용하도록 구성하였다. 추가로, 논문 자체의 서지정보를 전후처리 없이 추출/생성하는 모델의 가능성을 확인하기 위하여 참고문헌 영역까지 아우르는 모델을 구축하여 비교 실험을 진행하였다. 실험 결과 본 논문에서 제안하는 방식이 서지정보를 전후처리 하지 않고 진행한 비교 실험에 비하여 더 높은 성능을 보였다.

의류 사이즈별 및 피부톤에 기반을 둔 의류 추천 시스템 (Suitable clothing recommendation system by size and skin color)

  • 박창영;임병찬;이원준;이창수;김민수;이상용
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.407-413
    • /
    • 2022
  • 기존 의류 추천 시스템들은 사용자 자신의 신체 촬영 사진이나 신체 사이즈를 입력한 후, 사용자가 좋아하는 의류의 종류를 선택하면 그에 적합한 사진을 보여주는 수준에 머물러 있다. 이러한 추천 시스템을 이용하여 사용자가 의류를 구매할 경우, 사용자의 신체 사이즈에 맞지 않거나 어울리지 않는 경우가 다수 발생하게 된다. 본 연구에서는 기존 의류 추천 시스템들의 이런 문제점을 해결하기 위하여 사용자가 사이즈 뿐만 아니라 피부톤을 입력받아 사용자의 신체 사이즈 뿐만 아니라 피부톤에 알맞는 의류를 추천하는 시스템을 구현하였다. 본 시스템은 의류 추천을 위해 남성 상의 8가지를 대상으로 웹 크롤링을 통해 얻은 의류의 사이즈 정보를 주기적으로 데이터베이스에 저장하고, 해당 의류 이미지의 전체 픽셀을 분석하여 색감 텍스트 값을 추출하였다. 본 시스템의 성능을 확인하기 위하여 남자 대학생 100명을 대상으로 설문 조사를 실시하였으며, 70% 수준의 만족도를 보였다. 만족하지 않는 대부분의 이유는 추천 대상 의류가 한정되어 있다고 밝혀서 추후 대상 의류의 확대가 필요할 것으로 판단된다.

저출산 대응 정책 비교분석 (육아휴직과 아동수당의 비정형 데이터 중심으로) (Comparative Analysis of Low Fertility Response Policies (Focusing on Unstructured Data on Parental Leave and Child Allowance))

  • 금은영;김도희
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.769-778
    • /
    • 2023
  • 본 연구는 현재의 심각한 저출산 문제의 해결방안 중 두 가지 주요정책인 육아휴직과 아동수당의 비정형 데이터를 활용하여 비교분석하고 이를 토대로 관련 대응 정책의 향후 방향과 시사점을 모색하였다. 수집 키워드는 "저출산+육아휴직", "저출산+아동수당"으로 하였으며, 자료분석은 텍스트 빈도분석, 중심성 분석, 네트워크 시각화, CONCOR 분석 순으로 진행하였다. 분석 결과 첫째, 육아휴직은 아동수당 보다 다각적이고 체계적인 논의들이 데이터 분석상 나타남으로써 저출산 대응 정책에 있어 현실적이고 실질적인 정책임을 알 수 있었다. 둘째, 아동수당은 데이터 분석상 아동수당을 포함한 현금지원급여제도에 대한 정보와 관심도는 높은 것으로 나타났으나 그 이외의 특이점이나 적극적인 논의는 이루어지지 않았다. 향후 개선방안으로 두 정책 모두 기존 제도의 활용에 있어 첫째, 육아휴직은 제도의 확산을 위한 근로환경과 사각지대의 개선이 필요하며, 둘째 아동수당은 지급에 있어 획일적이고 편중된 것에서 벗어난 형식의 변화가 모색되어야 하며, 수급연령 확대를 제안하였다.

지방소멸 대응 정책의 특징 및 변화 분석: 일본의 마을·사람·일자리 창생 종합전략 및 기본방침을 사례로 (Characteristics and Changes of Policy Responses to Local Extinction: A Case of Comprehensive Strategy and Basic Policy on Community-Population-Job Creation in Japan)

  • 장석길;양지혜;김태형
    • 지역연구
    • /
    • 제40권1호
    • /
    • pp.37-51
    • /
    • 2024
  • 국내 지방소멸에 대한 위기 의식이 확산됨에 따라 최근 메가시티 조성 등 지역활성화를 위한 다양한 정책 방안이 논의되고 있다. 한국은 행안부 주도로 '21년 인구감소지역을 지정하고 '22년 지방소멸대응기금을 신설하여 지원하고 있으나, 도입 초기 단계에 있어 현재까지 중앙정부 수준의 정책적 특징 및 변화를 파악하기는 어려운 상황이다. 지방소멸 측면에서 한국과 유사한 특성을 보이는 일본은 지방창생법, 마을·사람·일자리 창생 종합전략 등 정부 주도의 유기적 대응 체계를 구축하고 있어, 중앙정부 수준의 정책적 특징과 함의를 파악하기에 적절한 사례로 여겨진다. 이에, 본 연구는 일본의 지방소멸 대응 정책인 제1기, 제2기 마을·사람·일자리 창생 종합전략 및 기본방침을 대상으로 텍스트 분석의 효율성 및 정확성을 높이는 토픽모델링을 사용하여 지방소멸 대응 정책의 특징 및 변화를 분석하였다. 나아가, 일본 지방소멸 분야의 전문가 심층인터뷰를 수행하여 분석결과의 타당성을 검증하였다. 분석결과, 1기 전략의 토픽으로는 경제·사회, 창업, 지방자치단체, 정주여건, 서비스, 산업이 도출되었으며, 2기의 토픽으로는 자원, 뉴노멀, 여성, 디지털 전환, 산업, 지역, 민관협력, 인구가 도출되었다. 1기 및 2기 전략의 정책적 변화에 영향을 미친 주요 요소로는 정책 대상, 시책 방향성, 환경 변화가 나타났으며, 이에 국내 지방소멸 대응 정책에 주는 함의로 인구감소지역의 특성에 따른 지원 정책의 차별화, 목적에 적합한 지방소멸 대응 접근(인구사회정책, 지역개발정책)의 적용, 유관 법정 계획과의 연계를 통한 지원 체계의 마련이 제시되었다.

대용량 복수후보 TTS 방식에서 합성용 DB의 감량 방법 (A DB Pruning Method in a Large Corpus-Based TTS with Multiple Candidate Speech Segments)

  • 이정철;강태호
    • 한국음향학회지
    • /
    • 제28권6호
    • /
    • pp.572-577
    • /
    • 2009
  • 대용량 음성 DB를 사용하는 음편접합 TTS는 부가적인 신호처리 기술을 거의 사용하지 않고, 문맥을 반영하는 여러 합성유닛들을 결합해 합성음을 생성하기 때문에 높은 자연성을 가진다는 장점이 있다. 중복되는 음편의 감량을 위해서 음성인식분야에서 사용되는 결정트리 기반의 트라이폰 군집화 알고리즘을 사용할 수 있지만 음편 내의 음향적 천이 특성을 반영하기가 어렵고 문맥질의 적용이 체계적이지 못하여 TTS에 바로 적용하기 어렵다. 본 논문에서는 DB감량을 위해 결정 트리 기반의 새로운 음소 군집화 방법을 제안한다. 먼저 음편의 처음, 중간, 끝 3프레임의 각 13차 MFCC벡터를 통합한 39차의 벡터로 음편내의 변이성과 연결성을 표현한다. 결정 트리의 상위부분에서는 포괄적인 문맥질의를 하위부분에서는 세부적인 문맥질의를 적용시켰다. 그리고 기존 결정트리 시스템과 제안된 시스템과의 성능평가를 위하여 평가용 트라이폰 모델의 음편과 트리에서 탐색한 트라이폰 모델의 음편들 간의 음향적 유사도를 DTW를 적용하여 계산하였다. 실험결과 제안된 방법을 사용할 경우 전체 음성DB의 크기를 23%로 줄일 수 있었고, 음향적 유사도가 높은 음편을 선택함을 보이므로 향후 소용량 DB TTS에 적용 가능성을 보였다.