• 제목/요약/키워드: 중요문장 추출

검색결과 152건 처리시간 0.026초

음성인식과 자연어 처리 딥러닝을 통한 전자의무기록자동 생성 시스템 (Automatic Electronic Medical Record Generation System using Speech Recognition and Natural Language Processing Deep Learning)

  • 손현곤;류기환
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.731-736
    • /
    • 2023
  • 최근 의료 현장은 전자의무기록, 전자건강기록 등의 의료 기록을 전산화하여 저장하고 관리하는 시스템이 의무적으로 적용되거나 전체 의료 현장에 보급되어 환자 개개인의 과거 의료 기록을 추가적인 의료 행위에 활용하고 있다. 그러나 일반적인 의료 문진 및 상담 간 발생하는 의료진과 환자 간의 대화는 별도로 기록되거나 저장되지 않고 있어 추가적인 환자의 주요 정보는 효율적으로 활용되지 못하고 있다. 이에 따라, 의료 문진 현장에서 발생하는 의료진과 환자와의 대화를 저장하고 이를 텍스트 데이터로 변환하여 주요한 문진 내용만 자동으로 추출, 요약하여 정보화하는 음성인식과 자연어 처리 딥러닝을 통한 의료상담 요약문을 자동으로 생성하는 전자의무기록 시스템을 제안한다. 본 시스템은 의료 종사자와 환자의 의료 상담 내용의 인식과정을 거쳐서 텍스트 정보를 획득한다. 이렇게 획득된 텍스트를 복수의 문장으로 구분하고, 생성된 문장에 포함된 복수 키워드의 중요도를 산출한다. 산출된 중요도를 기반으로 복수의 문장에 순위를 매기고, 순위를 기반으로 문장들을 요약하여 최종 전자의무기록 데이터를 생성한다. 제안하는 시스템 성능은 정량적 분석을 통하여 우수함을 확인한다.

한국 남성의 남자다움은 무엇인가?: 남성성에 대한 개념도 연구 (What is the masculinity of Korean men? Concept mapping of masculinity)

  • 우성범
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제25권3호
    • /
    • pp.203-229
    • /
    • 2019
  • 본 연구의 목적은 한국사회의 남성들의 남성규범을 구성하는 요인들을 확인하고, 그 개념적 구조를 파악하는 것이다. 남성성 개념의 이론적 근거에 따라 사회문화적으로 형성된 남성성 역할 기준에 순응하고자 하는 정도를 남성성으로 정의하였다. 이를 위하여 개념도 방법을 사용하여 20명의 남성참가자들을 대상으로 한국사회에서 남자답다는 것은 무엇인지 심층면접을 실시하였다. 이후 남성규범과 관련한 핵심문장을 추출한 후 참가자에게 추출된 55개의 핵심문장에 대해 분류하고 그 중요도를 평정하게 하였다. 참가자들이 분류한 문항에 대해서는 다차원척도법과 군집분석을 실시하여 남성규범에 대한 개념적 구조를 탐색하였다. 그 결과 나타난 이차원의 축을 한국사회 문화에 대한 이론과 내용을 바탕으로 각각 집단관계 영역 대 개인내적 영역, 사회적영역과 위계성 추구 대 온정적 관계 추구로 명명하였다. 또한 하위 군집으로는 부양자, 리더쉽, 정서억제, 직무능력과 조직사회적응, 기대외는 남성적 능력, 힘과 통제의 6가지 군집이 나타났다. 각 군집의 특징과 의미를 한국사회문화 맥락에 따라 해석하고 연구의 의의, 제안점 및 추후 연구에 대한 제언 등을 논의하였다.

유사도 측정 기법을 이용한 효율적인 요구 분석 지원 시스템의 구현 (Implementation of an Efficient Requirements Analysis supporting System using Similarity Measure Techniques)

  • 김학수;고영중;박수용;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.13-23
    • /
    • 2000
  • 소프트웨어가 점점 복잡해지고 대형화됨에 따라서 사용자의 요구가 매우 다양해지고 있으며, 제품에 대한 기대 수준도 높아지고 있다. 그러므로, 사용자의 요구 사항을 정확히 분석하여 효과적으로 개발 단계에 적용하는 것은 매우 중요하다. 본 논문에서는 자연어로 표현되는 요구 사항 문서의 분석 시에 나타나는 오류를 효과적으로 줄이고, 수정하는데 사용될 수 있는 요구 분석 시스템을 제안한다. 제안된 시스템은 문서간 유사도 측정에 의해서 문서간의 의존성(dependency) 분석을 지원하고 문장간 유사도 측정에 의해서 요구 사항간의 연계성(traceability), 중복성(redundancy), 불일치성(inconsistency), 그리고 불완전성(imcompleteness)을 발견하는 것을 지원한다. 또한 모호한 문장을 추출하여 요구사항의 불명확성 (ambiguity)을 발견하는 기능도 제공한다. 문서간 유사도 측정을 위해서 사용된 색인 방법은 슬라이딩 윈도우 모델과 의존 구조 모델을 결합한 것으로 각 모델이 가지는 단점을 효과적으로 보완할 수 있다. 본 논문에서는 문서간, 문장간 유사도 측정 기법의 효율성을 실험을 통해 검증하였으며 구현된 시스템을 통해 분석 처리되는 과정을 보여주고 있다.

  • PDF

내용 기반 검색을 위한 뉴스 비디오 키 프레임의 특징 정보 추출 (Extraction of Features in key frames of News Video for Content-based Retrieval)

  • 정영은;이동섭;전근환;이양원
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2294-2301
    • /
    • 1998
  • 본 논문은 방송사별 각 장면의 중요한 내용의 성격을 갖고 있는 특징을 방송사별 뉴스 비디오에서 추출하기 위한 것이다. 추출하고자 하는 특징의 요소는 방송사 구별을 위한 방송사 아이콘과 각 장면의 대표적 성격을 갖고 있는 아이콘, 각 장면내의 주요 내용을 대표하는 정보인 자막의 문장 추출이다. 본 논문에서 제안하는 방법은, 비디오 프레임으로 입력되는 영상을 YIQ칼라 공간으로 전환한 뒤 히스토그램 평활화 방법을 이용하여 입력 영상의 영역 구분을 명확하게 한 후에, 영상의 에지를 추출하고 수직과 수평선에 기반한 에지 히스토그램의 비교에 의하여 원하는 특징을 추출하는 것이다. 또한 히스토그램 차이값에 의해서 선택된 키 프레임들 중에서 뉴스 아이콘을 추출하고 아이콘에 의하여 각 장면을 분할 할 수 있는 방법을 제안하였다. 본 논문에서는 칼라 히스토그램이나 웨이블릿, 또는 객체의 움직임에 기반한 복잡한 방법대신 에지 히스토그램 비교 방법을 사용하여, 알고리즘을 간소화함으로써 계산 시간을 단축하였으며 특징 추출에도 좋은 결과를 나타냈다.

  • PDF

학술대회 및 저널별 기술 핵심구 추출 모델 (A Keyphrase Extraction Model for Each Conference or Journal)

  • 정현지;장광선;김태현;신동구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.81-83
    • /
    • 2022
  • 연구 동향을 파악하는 것은 연구 수행 시 필수적인 요소이다. 대부분의 연구자들은 관심분야의 학술대회 및 저널을 대표하는 기술 핵심구나 관심 분야를 검색함으로써 연구 동향을 파악한다. 하지만, 최근 인공지능과 같은 특정 분야의 경우 한 개의 학술대회에 한 해당 수백~수천 개의 논문이 출간되기 때문에 전체 분야의 경향성을 파악하는 데 어려움이 존재한다. 본 논문에서는 학술대회 또는 저널 제목을 활용하여 기술 핵심구를 자동으로 추출함으로써 연도별 학술대회 및 저널의 연구 동향 파악을 지원하고자 한다. 핵심구 추출은 문장 또는 문서를 대표하는 주요 구문을 추출하는 작업으로서 검색, 요약, 내용 파악 등을 위해 근간이 되는 기술이다. 기존 사전학습 언어모델 기반의 핵심구 추출 모델은 문서 단위의 긴 텍스트를 기준으로 모델링 하였기 때문에 제목 단위의 짧은 텍스트에서는 성능이 낮아진다는 단점이 존재한다. 본 논문에서는 짧은 텍스트에 강인하면서 단어 자체의 중요도를 고려한 학술대회 및 저널의 기술 핵심구 추출 모델을 제안하고자 한다.

  • PDF

인간배아줄기세포 배양 성공 난자핵 추출에 비결 있었다

  • 이은정
    • 과학과기술
    • /
    • 4호통권419호
    • /
    • pp.24-27
    • /
    • 2004
  • 국내 연구진이 세계 최초로 사람의 체세포와 난자를 이용해 인간배아줄기세포를 만들어내는데 성공했다. 연구책임자인 황우석(서울대 수의대), 문신용(서울대 의대) 교수는 세계적인 과학학술지 사이언스의 초청으로 지난 2월 미국 시애틀에서 국제기자회견을 가졌다. 한국 과학자가 뉴욕타임스, BBC, 워싱턴포스트 등 세계 유수의 언론사를 대상으로 대규모 기자회견을 가진 것은 처음 있는 일이다. 이 연구는 전세계 언론에 대서특필되면서 세계 생명공학계에‘태극기를 휘날린’대단한 사건으로 받아들여지고 있다. 황 교수팀의 배아줄기세포연구를 간단히 요약하면‘사람의 난자에 사람의 체세포핵을 넣어 복제배아를 만들고 배양을 통해 인간배아 줄기세포로 분화시킨 것’이다. 그런데 왜 이 문장 하나에 수많은 사람들이 놀라고 열광하는 것일까. 귀국 이후 쏟아지는 인터뷰 요청을 사양하고 다시 실 험실로 돌아가 연구에 몰두하고 있는 황 교수를 어렵게 만났다. 인간배아줄기세포 생산 성공까지의 중요한 과정들을 황 교수와 문답으로 다시 풀어본다.

  • PDF

의미속성에 기반한 한국어 명사 의미 체계 (A Korean Noun Sematic Hierarchy based on Semantic Features)

  • 조평옥;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권4호
    • /
    • pp.584-594
    • /
    • 1999
  • 의미 체계는 한국어 기초어휘에 대한 개념지식을 구축하는데 기본이 될 뿐만 아니라, 문장 분석시의 구조적 모호성과 단어 의미 모호성을 해소하는 중요한 단서를 제공할수 있다. 이러한 의미 체계가 실용적으로 여러 응용 시스템에서 사용되기 위해서는 광범위하고 타당한 자료를 바탕으로 하여 객관적인 방법으로 설정되어야한다. 국어 사전의 뜻풀이말에서의 상위개념을 표제어의 상위어로 선정하는 bottom-up 방식으로 구축하였던 한국어 명사의미체계는 사전편찬시의 비일관적인 뜻풀이말의 기술에 따른 여러 문제점이 있었다. 본 연구에서는 이러한 문제점들을 해결하기 위해서 사전 뜻풀이말에서 상위개념을 수식하는 어절과 용언의 의미호응관계에서 상위개념의 의미속성을 추출하고, 이들 의미 속성에 의한 명사의미체계를 구축하고 이를 바탕으로 명사의미 TAG를 설정할수 있다.

일반화된 패턴을 이용한 관계 추출 시스템 (Relation Extraction System using Generalized Patterns)

  • 김혜민;최익규;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.658-660
    • /
    • 2005
  • 텍스트 형태의 문서에는 않은 종류의 유용한 관계가 존재한다. 이러한 관계들을 문서에서 자동으로 찾아내는 것은 정보검색 분야에서 매우 중요한 작업 중 하나이다. 그러나 각각의 관계마다 다양한 형태의 패턴이 존재하기 때문에 많은 양의 문서에서 이러한 관계들을 찾아내는 것은 쉬운 일이 아니다. 이러한 어려움을 해결하기 위해 본 논문에서는 일반화된 패턴을 이용하여 자동으로 관계를 찾는 방법을 제안한다. 본 논문에서 제안하는 방법은 초기에 사용자로부터 얻은 정보를 이용하여 관계를 자동으로 찾는다. 약 1,000,000개의 문장을 이용해 실험한 결과 자동으로 일반화된 패턴을 이용하는 방법을 이용할 경우 그렇지 않은 경우보다 성능이 향상됨을 확인할 수 있었다.

  • PDF

객체 탐지 및 빔 서치를 이용한 영상 주석 환각 해결 (Removing object hallucination through a reviewing mechanism)

  • 고지은;정승준;김창익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.243-245
    • /
    • 2019
  • 영상 주석 생성 기술은 주어진 영상에 대하여 최대한 자세히 묘사하는 문장을 생성하는 것을 목표로 한다. 따라서, 이 분야에서는 생성된 주석과 입력 영상 간의 연관성이 가장 중요하다. 영상 주석 생성과 관련된 최근 연구들은 영상 내에서 집중해야 될 후보 영역들을 먼저 추출한 뒤, 이들을 LSTM 디코더 등에 입력하여 주석을 생성한다. 비록, 최근에 제안된 방법들이 입력 영상과 매우 연관성 높은 주석들을 생성하지만, 아직 영상 안에 존재하지 않는 물체가 종종 생성된 주석에 포함되는 환각(Hallucination) 문제가 발생하고 있다. 본 논문에서는 이를 해결하기 위하여 Beam search를 이용하여 기존 방법들보다 더 정확한 여러 주석 후보 군을 생성한 뒤, 각각의 주석을 객체 검출기에서 나온 객체 후보군과 비교하는 방법을 제안한다. 우리는 제안한 방법을 최근에 제안된 주석 생성 기술에 접목한 결과, 환각 문제가 효과적으로 제거되는 것을 확인할 수 있었다. 또한, MS COCO 온라인 서버 제출을 통하여 주석 생성기술의 성능이 향상되는 것을 확인하였다.

  • PDF

시간의 단위별 처리를 이용한 자동화된 한국어 시간 표현 인식 및 정규화 시스템 (Automatic Recognition and Normalization System of Korean Time Expression using the individual time units)

  • 선충녕;강상우;서정연
    • 인지과학
    • /
    • 제21권4호
    • /
    • pp.447-458
    • /
    • 2010
  • 시간 정보는 문서나 문장 등에서 매우 중요한 정보로 사용되기 때문에 다양한 종류의 데이터에서 시간 정보의 인식은 매우 중요하다. 시간 정보는 일정한 형태를 가진 것으로 간주되지만 실제 사용되는 시간 표현은 매우 다양하고 복잡하며 정보의 일부가 빈번하게 생략되는 경우가 발생한다. 본 연구에서는 시간 표현의 추출뿐만 아니라 추출된 표현을 정규화된 표준 형식으로 변환하는 범용 시간 표현 추출 및 변환 시스템을 제안한다. 다양한 시간 표현의 추출과 변환에 필요한 노력을 줄이고 새로운 데이터에 대한 확장성을 보장하기 위해 기본 시간 단위를 정의하였다. 추출단계에서는 기본 시간 단위의 조합으로 구성된 사전을 사용하여 가능한 시간 표현들을 추출한다. 정규화 변환 단계에서는 인접 추출 정보와 기준 시간 등을 사용하여 생략된 기본 시간 단위 정보를 복원하고 최종적으로 모든 기본 시간 정보들은 통합되어 정규화된 표준 형식으로 변환된다. 제안한 시스템은 모바일 기기 등의 잡음 환경에서 강인한 성능을 보장하며 영역이나 언어에 대해 독립적이므로 많은 영역에서 응용이 가능하다. 본 연구는 실험에서 다량의 오류가 포함된 SMS 데이터에서 시간 표현 추출 정확도 93.8%, 시간 표현 변환 정확율 93.2%을 보임으로써 오류에 강인하면서도 높은 성능을 유지함을 증명하였다.

  • PDF