• 제목/요약/키워드: 출현빈도

검색결과 983건 처리시간 0.033초

교육학 분야 국내 학술 논문 저자키워드 출현 순서에 따른 빈도가 저자키워드의 논문 제목 출현 빈도에 미치는 영향에 관한 연구 (A Study on the Effects of the Appearance Sequence of Author Keyword on the Appearance Frequency of Article Title in the Education)

  • 윤은빈
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2014년도 제21회 학술대회 논문집
    • /
    • pp.119-122
    • /
    • 2014
  • 본 연구는 교육학 분야에서 국내 학술 논문 저자키워드 출현 순서에 의미가 있는지 알아보기 위하여 저자키워드 출현 순서별로 빈도를 조사하고 동 저자 키워드가 제목에 출현하는지를 살펴본 후, 학술논문 저자키워드 출현 순서에 따른 빈도가 저자키워드의 논문 제목 출현 빈도에 미치는 영향에 대해 연구하고자 한다. 연구의 배경은 구조적 학술용어사전의 구축과 관련해서 효율적인 용어 선정이나 용어 분류 방법을 찾는 것이다. 연구의 목적을 위해 교육학 분야 저자키워드의 출현 빈도수가 1인 것을 제외하고 고빈도 순으로 400개 용어를 추출하였다. 저자키워드의 몇 번째 출현 순서가 저자키워드의 제목 출현에 가장 큰 영향을 미치는지 알아본 결과, 저자키워드의 첫 번째 출현이 아닌 두 번째 출현이 가장 큰 영향을 미친다는 것을 알 수 있었다.

  • PDF

상대빈도를 이용한 문법형태소의 인식 방법 (A Method of Function-word Recognition by Relative Frequency)

  • 강승식
    • 인지과학
    • /
    • 제10권2호
    • /
    • pp.11-16
    • /
    • 1999
  • 한글 문서에서 일부 조사와 일부 어미들은 출현 빈도가 높은 반면에 그 외에 조사와 어미는 출현빈도가 낮을 것으로 추측되고 있다. 본 연구에서는 실험을 통해서 이러한 사실을 확인하고 한국어 분석 시스템에서 활용하기 위하여 조사와 어미의 상대적 출현 빈도를 조사하였다. 조사의 상대적 출현 빈도를 조사한 결과, 말 뭉치 분야에 따라 약간의 차이가 있으나 일반적으로 빈도수가 높은 9개의 조사가 전체 조사의 70%를 차지하고 상위 20개, 32개, 69개의 조사가 각각 90%, 95%, 99%를 차지하고 있음을 확인하였다. 어말 어미는 빈도수가 높은 10개의 어말 어미가 전체 어말 어미의 70%를 차지하고 상위 33개, 54개, 117개가 각각 90%, 95%, 99%를 차지하고 있다. 본 논문에서는 조사와 어미의 상대적 출현 빈도에 따라 문법형태소 사전을 구성하는 방법을 제안한다. 조사와 어미의 상대적 출현 빈도는 미등록 어 추정이나 형태론적 중의 성을 해결할 때도 활용된다.

  • PDF

한국의 이상기온 출현 빈도의 변화와 그 요인에 관한 연구 (Changes of Unusual Temperature Events and their Controlling Factors in Korea)

  • 허인혜;이승호
    • 대한지리학회지
    • /
    • 제41권1호
    • /
    • pp.94-105
    • /
    • 2006
  • 본 연구에서는 우리나라의 여름과 겨울철의 이상기온 출현 빈도의 변화와 그에 영향을 미치는 요인과의 관계를 파악하고자 하였다. 우리나라의 대부분 관측 지점에서는 여름철 이상고온 출현 빈도의 증가와 겨울철 이상저온 출현 빈도의 감소 경향이 뚜렷하다. 이러한 이상기온 출현 빈도의 변화는 대기 순환 지수 중 겨울철 이상기온 출현에 영향을 미치는 겨울 몬순 지수와 시베리아 고기압 강도 지수 및 북극 진동 지수, 그리고 여름철 이상저온 출현에 영향을 미치는 오호츠크해 고기압 강도 지수와 북태평양 지수 등의 변화 경향과 유사하다. 이 지수들은 이상기온의 변화에 영향을 미치는 요인 중 최근의 지구 온난화 경향을 반영하며 우리나라 전 지역의 이상기온 출현 빈도와 관계가 뚜렷하다.

상대적 출현 빈도를 이용한 조사/어미 사전의 구성 (A Construction of Josa/Eomi Dictionary using Relative Frequency)

  • 강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.188-194
    • /
    • 1995
  • 한글 문서에서는 일부 조사와 일부 어미가 자주 출현하며 그 외의 조사/어미는 출현 빈도가 낮을 것으로 추측되고 있다. 본 연구에서는 실험에 통해서 이러한 사실을 확인하고 자주 출현하는 통합형 조사와 어미의 빈도를 구하기 위하여 한국어 말뭉치에서 통합형 조사와 통합형 어미의 상대적 출현 빈도를 조사하였다. 통합형 조사의 상대적 출현 빈도를 조사한 결과 말뭉치의 분야에 따라 약간의 차이가 있으나 평균 상위 9개의 통합형 조사가 전체 조사의 70%를 차지하고 있으며 상위 20개, 32개, 69개의 통합형 조사가 각각 90%, 95%, 99%를 차지하고 있음을 확인하였다. 통합형 어말어미의 경우에는 상위 10개의 통합형 어말어미가 전체 어말어미의 70%를 차지하고 상위 33개, 54개, 117개의 통합형 어미가 각각 90%, 95%, 99%를 차지하고 있다. 본 논문에서는 조사, 어미의 상대적 출현 빈도에 따라 계층적으로 조사/어미 사진을 구성함으로써 형태소 분석 효율을 높이고 형태소 분석기가 다양한 응용 분야에 쉽게 적응할 수 있도록 하는 방법을 제안한다. 또한 통합형 조사, 어미의 상대적 출현 빈도는 미등록어 추정을 용이하게 하거나 형태론적 모호성을 해결할 때에도 유용하게 활용될 수 있음을 보인다.

  • PDF

단어 구름과 동적 그래픽스 기법을 이용한 영어성경 텍스트 시각화 (English Bible Text Visualization Using Word Clouds and Dynamic Graphics Technology)

  • 장대흥
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.373-386
    • /
    • 2014
  • 단어 구름은 문자 텍스트 상의 복수개의 단어들을 대상으로 그 단어들의 출현 빈도에 비례하는 글자의 크기나 글자의 색깔로 중요도를 나타내는 텍스트 시각화 방법이다. 이 그림은 텍스트 상의 핵심단어를 재빨리 인지하고 단어들의 상대적 출현빈도수에 맞추어 배열하는 데 유용하다. 동적 그래픽스를 이용하여 텍스트 장들의 변화에 따른 핵심단어와 단어출현빈도의 패턴의 변하는 모습을 살필 수 있다. 행들이 텍스트 상의 장들이고 열들이 텍스트에 출현하는 단어들의 출현빈도수 순위들인 단어출현빈도행렬을 정의할 수 있고 이 행렬을 이용하여 단어출현빈도행렬그림을 그릴 수 있다. 동적 그래픽스를 이용하여 출현빈도수 순위의 변화에 따른 단어출현빈도행렬의 패턴의 변하는 모습을 살필 수 있다. 우리는 단어 구름과 동적 그래픽스 기법을 사용하여 영어성경 텍스트 시각화를 수행할 수 있다.

고빈도어를 이용한 복합명사 색인어 추출 방안 (The Generation Methods of Composition Noun For Efficient Index Term Extraction)

  • 김미진;박미성;장혁창;최재혁;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.121-129
    • /
    • 1998
  • 정보검색이나 자동색인 시스템에서는 정확한 색인어의 추출이 시스템의 성능을 좌우하게 된다. 따라서 정확한 색인어의 추출이 매우 중요하다. 본 논문에서는 정보 검색시에 보다 정확한 문서를 찾아줄 수 있도록, 출현 고빈도어를 이용하여 효율적인 색인어 추출을 위한 합성 명사 생성방안을 제시한다. 이를 위하여 문서 내에서 출현 빈도가 높은 명사, 즉 상위 $30%{\sim}40%$의 고빈도 명사에 합성 및 분해 규칙을 적용하여 합성명사 색인어를 추출한다. 또한 본 논문에서 제시한 상위 $30%{\sim}40%$ 고빈도 명사합성에 대한 타당성을 검증하기 위하여 적절한 명사합성 빈도를 구한다. 제안한 방법을 적용한 결과 300어절 이하의 짧은 문서는 출현빈도 상위 30%까지의 명사를 합성했을 경우 저빈도 누락이 작았고 300어절 이상의 문서는 출현빈도 40%까지 합성하면 저빈도 누락이 상당히 줄어듦을 알 수 있었다. 그리하여 전체 색인어의 개수를 줄였고 색인어의 정확률을 높였다.

  • PDF

웹문서에서의 출현빈도를 이용한 한국어 미등록어 사전 자동 구축 (Automatic Construction of Korean Unknown Word Dictionary using Occurrence Frequency in Web Documents)

  • 박소영
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.27-33
    • /
    • 2008
  • 본 논문에서는 한국어 형태소 분석의 성능향상을 위해서, 어절에서 미등록어를 인식하여 자동으로 사전을 구축하는 방법을 제안한다. 제안하는 사전 구축 방법은 전문 분석 기반 사전 구축 방법과 웹 출현빈도 기반 사전 구축방법으로 구성되어 있다. 전문 분석 기반사전 구축 방법은 전체 문서에서 반복적으로 나타나는 문자열을 미등록어로 인식하고, 웹 출현빈도 기반사전 구축 방법은 반복되지 않은 문자열을 웹 문서에서 검색하여 그 출현빈도를 바탕으로 미등록어를 인식한다. 실험결과 전문 분석만을 바탕으로 하는 기존 접근방법에 비해서 웹 문서에서의 출현빈도도 함께 고려하여 제안하는 사전 구축 방법은 32.39% 정도 재현율이 높게 나타났다.

  • PDF

모색발현 유전자의 DNA Marker를 이용한 쇠고기 품종 판별

  • 신성철;채지선;김혜정;최은주;김희선;김현석;정의룡;정구용
    • 한국축산식품학회:학술대회논문집
    • /
    • 한국축산식품학회 2004년도 정기총회 및 제33차 춘계 학술대회
    • /
    • pp.172-176
    • /
    • 2004
  • 본 연구는 축우의 모색발현을 조절하는 MCIR, MGF 및 TYRP1 3종류의 모색 유전자를 이용하여 한우육 판별기술을 개발하고자 PCR-RFLP 기법으로 이들 모색유전자 좌위의 대립유전자를 검출하고 각 품종 간 RFLP 유전자형 출현빈도를 비교 분석하였다. MCIR 유전자의 RFLP 유전자형 출현빈도에서 한우는 e/e과 E+/e형이 출현되었고 이외의 다른 유전자형의 출현은 전혀 인정되지 않았다. 그러나, Holstein종 젖소는 $E^D/E^D$$E^D/e$ 2종류의 유전자형 그리고 Angus종에서는 $E^D/E^D$, $E^D/E^++$$E^D/e$ 3종류의 유전자형이 각각 출현하여 한우와 이들 두 품종간의 MCIR유전자형 출현빈도에 뚜렷한 차이가 인정되었다. MGF 유전자의 RFLP 유전자형 출현빈도에서 한우는 R/r과 r/r형이 각각 25%와 75%로 rr형의 출현율이 비교적 높았으며 Holstein종과 Angus 종은 R/r형이 100% 출현했으며, Charolais 종은 rr형이 100% 출현하였고 이외의 다른 유전자형은 인정되지 않았으며 Hereford종은 RR형이 80% 그리고 R/r형이 20%의 출현율을 보여 RR형의 출현율이 매우 높아 한우와 Holstein 및 육우 품종간의 MGF 유전자형 출현빈도에 명백한 차이가 인정되었다. 따라서, 소 모색관련 MCIR과 MGF 유전자의 품종 특이적 PCR-RFLP 유전자형은 한우육과 국내산 Hostein 젖소육 및 도입육우 품종을 식별하는데 매우 유용한 DNA marker로 이용될 수 있음이 확인되었다.

  • PDF

선재도산 이매구 유생의 출현빈도에 관한 생태학적 관찰 (Ecological Observation on the Appearance Frequency of the Bivalve Karvae in SUn-Jae Island)

  • 최기철;주일영;이종국
    • 한국동물학회지
    • /
    • 제4권1호
    • /
    • pp.13-20
    • /
    • 1961
  • 우리나라 서해안인 경기도 부천군 선재도에서 산출되는 이매구류의 출현 빈도 분포 상태를 1959년 8월부터 1960년 10월에 걸쳐서 생태학적인 조사를 하였다. 1) Sampling 은 motor pump를 사용하여 원하는 깊이에 따라 각각 plankton을 채집하여 현미경으로 고나찰하여 KArvae 의 수를 조사하였다. 2) 각 stage의 larvae을 측정한 결과, 가장 어린 것은 60$\times$54$\mu$이었고, 가장 큰 것 은 320$\mu$336$\mu$이었다. 3) 이매구의 larvae 들은 수중에서 불규칙하게 분포하였다. 온도의 상승에 따라서 larvae의 분포는 증가되고, 대체로 온도가 하강함에따라서는 감소되었다. 4) 어린 stage의 larvae 수는 7월-9월 에 걸쳐 출현빈도가 높았다. 이것은 이시기가 선재도에 있어서는 이매구류의 산란시기라고 생각된다. 5) 8월-9월에 걸쳐서 대형의 alrvae의 출현빈도가 감소되는데, 이것은 larvae가 착생되었기 때문이라 생각된다.

  • PDF

7학년 국어교과서의 어휘 통계조사 -노미숙, 김태철 교과서를 중심으로- (Statistical Survey of Vocabulary in Korean Textbook for 7th-Grade -Focus on the No's and the Kim's Textbooks-)

  • 김철수
    • 한국콘텐츠학회논문지
    • /
    • 제14권4호
    • /
    • pp.491-499
    • /
    • 2014
  • 본 연구는 중학교 7학년 국어교과서 4종에 나타나는 어휘들에 대한 통계(음절 개수, 음절 종류, 음절 출현 빈도, 어절 개수, 어절 종류, 어절 평균 길이, 어절 출현 빈도 등)를 조사하였다. 전체 한글 음절 개수는 286,801개, 한글 음절 종류는 1,350개, 음절 평균 출현빈도는 212.4회이다. 어절 개수는 109,393개, 어절 종류는 29,356개, 어절 평균 출현빈도는 3.7회이다. 평균 음절 길이는 2.7음절이며, 한글 어절 중 가장 긴 어절길이는 8이다.