• 제목/요약/키워드: 이름

검색결과 1,633건 처리시간 0.025초

사회망 기반 순환 탐지 기법을 이용한 저자명 명확화 기법 (Name Disambiguation using Cycle Detection Algorithm Based on Social Networks)

  • 신동욱;김태환;정하나;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.306-319
    • /
    • 2009
  • 이름은 사람을 구별하기 위한 특징이지만 여러 사람이 하나의 이름을 공유하는 경우와 한 사람이 여러 이름을 사용하는 경우 때문에 이름만으로는 사람을 명확히 구별할 수 없다. 이러한 문제는 정보 검색 분야에서 문서 검색이나 웹 검색, 데이터베이스 통합 등에 영향을 미친다. 특히 서지 정보에는 저자들 중 동명이인이 존재하거나 한 저자가 축약된 이름 혹은 잘못된 철자를 사용하기도 하기 때문에 에러정보가 많이 포함되어 있다. 이러한 문제를 해결하기 위해 데이터베이스에 입력된 자료 중 이름에 대한 정보를 명확하게 해야 한다. 본 논문에서는 저자간의 관계로부터 구축된 사회망을 이용해 이름의 모호성을 해결하는 방법을 제안하고 컴퓨터 과학 서지정보를 제공하는 DBLP(Digital Bibliography & Library Project) 데이터를 기반한 실험을 통해 제안한 시스템의 성능의 효율성을 평가하였다.

기계학습 알고리즘에 근거한 단백질 이름의 자동 추출 (A Machine Learning Approach for Automatic Protein Name Extraction from Journal Articles)

  • 김정호;백은옥;이공주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.259-261
    • /
    • 2004
  • 생물학 분야의 문헌으로부터 유전자 및 단백질 이름을 추출하는 기술은 바이오 텍스트 마이닝 분야의 기반 기술로 그 중요성이 점차 증대되고 있다. 이 연구에서는 생물학 분야 문헌의 초록으로부터 하나의 토큰으로 구성된 single gene name은 물론 여러 개의 토큰으로 이루어진 multi gene name까지 유전자나 단백질의 이름을 자동으로 추출하는 시스템 TagGeN(Tagger for Gene Name)을 제안한다. TagGeN은 기존의 태거와 달리, 문자나 숫자 이외의 기호를 포함한 유전자나 단백질 이름의 품사 처리에 있어 개선 방안을 제시하고, 여러 토큰으로 이루어진 이름의 인식에 있어 나란한 두 토큰이 갖는 태그 정보를 이용한 조건부 확률에 근거하여 Markov 모델을 도입한다. 위와 같은 개선방안을 구현한 TagGeN은 성능면에서 기존의 유사시스템에 비해 recall 20.8%, precision 4.7%의 성능향상을 보임으로써 본 연구에서 제안한 방법론의 효과를 입증한다.

  • PDF

Shale을 왜 '혈암'이라 하는가?

  • 이창진;류춘렬
    • 한국지구과학회:학술대회논문집
    • /
    • 한국지구과학회 2010년도 춘계학술발표회 논문집
    • /
    • pp.24-24
    • /
    • 2010
  • 중등 지구과학교과서와 대학 교재에서 학습하는 광물과 암석 이름은 대부분 영어, 한자, 일본어에서 도입한 용어이다. 이 용어에 대한 어원과 말뜻에 대한 분석이나 연구가 되지 않은 상태에서 바로 사용해왔기 때문에 지질학 초보자들이 학습하기에 아주 어렵다. 광물과 암석이름의 어원과 말뜻을 잘 알지 못하고 단순히 외우거나 학술적인 이름이나 의미만을 생각하고 사용하고 있으며, 한 광물이나 암석에 대하여 여러 가지 이름을 사용하기도 한다. 심지어 전혀 엉뚱한 암석 이름이 대중 사이에서 사용되고 있지만 이를 통제하지도 못하고 그 명칭이 틀렸다는 것도 모르고 있다. 예를 들면 영어로 Shale을 중등 교과서와 대학 교재에서 영어 발음을 따라 한국어로 셰일이라고 표기하지만 중국과 일본에서는 혈암(頁岩)으로 표기한다. 우리나라의 대중 매체의 인터넷 사전과 대중들이 사용하는 용어는 중국어 혈암(頁岩)을 공공연하게 '혈암'으로 표기하고 있다. '혈(頁)'을 한자 사전에서 찾아보면 '머리 혈'과 '책 면 엽'으로 정리되어 있다. 그러면 셰일의 암석학적 특징으로 볼 때 혈암이라고 해야 하나? 엽암이라고 해야 하나? 과학과의 다른 분야에서는 어려운 한자를 쉬운 한글로 표준화하는 연구와 실행을 꾸준히 진행해오고 있다. 생물의 경우 생물의 어려운 학명을 이미 쉬운 한글로 표준화했으며, 그 학명이 학생과 대중들에게 널리 알려져 있다. 지구과학의 교과서 문장에 나오는 단어와 전문용어가 한자를 한글로 표기한 경우가 많은데 이 단어들을 하루 속히 한글로 표준화하여 전문가들이 먼저 사용하는 동시에 학생과 대중들에게 알려 주어야 한다. 이렇게 되면 지구과학의 내용보다 용어가 어렵다는 인식을 바꾸어 줄 것이고 지구과학을 전공하고자 하는 학생들에게 희망과 용기를 줄 것이다. 그 일환으로 광물과 암석 이름의 어원을 조사해 보고 한글 표준화의 가능성을 타진해 보고자 한다.

  • PDF

성인의 이름매력도가 자기효능감과 정서에 미치는 영향 (The Effect of Adult's Name Attractiveness on Self-efficiency and Emotionality)

  • 김기승;함혜수;나혁진
    • 산업진흥연구
    • /
    • 제5권1호
    • /
    • pp.99-106
    • /
    • 2020
  • 본 연구는 성인 남녀의 이름매력도가 자기효능감과 정서인식에 미치는 영향을 분석하기 위하여 실시하였다. 연구의 대상자는 수도권에 거주하는 10대부터 30대까지 남녀 300명을 모집단으로 하였다. 수집과정에서 누락된 설문지와 회수된 설문지 중 불성실한 설문지를 제외한 250부를 분석에 활용하였다. 변인에 따른 이름매력도의 차이를 분석한 결과 연령대와 학력이 낮을수록 자기 이름에 대해서 불만족이 높은 것으로 나타났다. 또한, 이름매력도가 자기효능감에 미치는 영향을 검증하기 위하여 실시한 회귀분석의 결과, 모형의 적합도는 R2=.382로 모형의 설명력은 다소 떨어지지만, β=.322, t값이 9.276, p<.001로 나타나 통계적 유의성이 있는 것으로 나타났다. 즉, 이름의 매력도는 자기효능감에 직접적인 영향을 미친다는 것을 알 수 있다. 그리고 이름매력도가 정서인식에 미치는 영향을 검증하기 위하여 실시한 회귀분석의 결과 R2=.412로 나타나 모형의 설명력은 41.2%를 보였다. 성별, 연령, 학력 등 인구 통계적 변인을 통제하고 실시한 회귀분석의 결과 β=.326, t값이 6.408, p<.001로 나타나 통계적 유의성이 있는 것으로 나타났다. 즉, 이름의 매력도는 정서인식에 영향을 미친다고 볼 수 있다. 이름의 매력도가 행복이나 삶의 질을 높일 수 있다는 실증연구는 아직 없다. 그러나 개명을 통해서 과거보다 좋아졌다는 이야기는 운동선수들 사이에서는 자주 볼 수 있다.

거제시 마을 이름에 대한 자연지리적 해석 -지형.기상.토양 관련 마을 이름을 중심으로- (Interpretation of Physical Geographic Meaning of Village Names in Geoje City, South Korea)

  • 강희순;범선규
    • 한국지역지리학회지
    • /
    • 제11권5호
    • /
    • pp.368-382
    • /
    • 2005
  • 본 연구는 거제시의 마을 이름 중에 그 명명 기반이나 유래가 자연환경, 즉 자연지리적 요소에 있다고 믿어지는 것을 가려낸 다음, 그 속에 담긴 의의를 고찰한 것이다. 거제시의 마을 이름 중에는 해당마을 일대의 특징 있는 지형 기상 토양 등을 명명기반으로 한 사례가 적지 않다. 특히 급사면의 산지가 넓고, 리아스식 해안이 발달한 거제도의 지형 특징이 뚜렷하게 반영되어 있다. 기상(기후)와 토양과 관련된 것으로 추정되는 관련 마을 이름도 여럿이어서 관심을 끈다. 자연지리적 특성이 부각된 마을 이름은 그 자체만으로도 의미가 있으며, 명명 주체인 주민들의 환경지각, 자연환경의 역사적 변천 등과 관련된 연구 자료로도 활용할 수 있다.

  • PDF

한국식물병명목록과 우리나라 나무병 이름에 대한 소고 (A Review of the List of Plant Diseases in Korea and the Names of Korean Tree Diseases)

  • 차병진;서상태;한상섭
    • 식물병연구
    • /
    • 제30권1호
    • /
    • pp.1-12
    • /
    • 2024
  • 1986년 우리나라 식물병명목록 단행본이 처음으로 발간된 이후 36년만에 6판이 만들어지고, 2023년에는 6판을 수정보완한 6.1판이 온라인으로 무료공개되었다. 학문과 기술 발전에 따라 병명목록에 수록된 내용도 증가하여 기주는 437분류군에서 1,420분류군으로, 병은 1,539종에서 6,680종으로 증가하였다. 이 중 수목병은 3,586종이고 기주는 504분류군으로, 이를 필요로 하는 전문가들에게 많은 도움을 주고 있다. 한편, 수목진료 법제화에 따라 정확한 병 이름의 중요성은 계속 커지고 있으나 아직도 많은 병 이름이 부적당하거나 잘못 사용되고 있어서 혼란이 생기고 있다. 명명 규정을 지키지 않은 병 이름들이 여전히 등재되어 있으며, 같은 병원균이 같은 분류군의 기주를 감염해도 병 이름이 다르게 부여되어 있고, 병의 특성을 나타내지 못하는 병 이름도 적지 않다. 우리말 병 이름 없이 보고되는 병들도 있으며, 병원성이 확인되지 않은 채 등재된 병 이름도 있다. 이러한 문제를 개선하기 위해서는 학회 병명심의위원회가 병명심의 및 등재 규정을 제정하고 새로운 병 이름은 논문 게재 전에 심의하는 체계를 갖추어야 할 것이다.

트래픽 모니터링을 통한 P2P 및 웹 하드 다운로드 응용의 파일이름 식별 방법 (A File Name Identification Method for P2P and Web Hard Applications through Traffic Monitoring)

  • 손현구;김기수;이영석
    • 한국정보과학회논문지:정보통신
    • /
    • 제37권6호
    • /
    • pp.477-482
    • /
    • 2010
  • 최근 파일 공유 및 인터넷 전화, 동영상 스트리밍 같은 진화된 인터넷 응용 서비스들이 등장하고 있다. 특히 P2P 또는 웹 기반 파일 공유 응용 들은 컨텐츠 불법 복제와 소수 사용자에 의한 다량의 트래픽 점유율 동의 문제를 지속적으로 제기하고 있다. 본 논문에서는 트래픽 모니터링을 통하여 P2P 응용 및 웹하드 응용에서 다운로드 받는 파일이름을 식별하는 방법을 제안하고 이의 실험 결과를 제시한다. 파일 이름을 식별하기 위해서 패킷 페이로드 내에 존재하는 한글 문자열을 디코딩하는 방법을 이용하였고, BitTorrent, 클럽박스 및 tple을 대상으로 실험하여 다운로드받는 파일이름을 탐지할 수 있음을 보였다.