• 제목/요약/키워드: 저빈도

검색결과 638건 처리시간 0.032초

단어빈도가 명사정의하기에 미치는 효과 (The Effect of Word Frequency on Noun Definitions)

  • 이찬종
    • 한국음향학회지
    • /
    • 제27권6호
    • /
    • pp.303-308
    • /
    • 2008
  • 본 연구는 한국어에서 단어빈도가 명사 정의하기에 미치는 효과를 살펴보는 것이다. 초등학생, 중학생, 고등학생, 대학생 80명을 대상으로 명사의 친숙도와 명사의 정의하기를 분석하였다. 의미범주를 "사용/목적," "묘사," "관련/관계," "부분설명," "설명," "오류," "부분설명-속성," "부분설명-특정 분류." "부분설명-비특정 분류," "설명-특정 분류," "설명-비특정 분류"로 분류하여 분석하였다. 그 결과 저빈도 명사보다 고빈도 명사의 경우 더 친숙도를 보였고 분류명사나 속성의 의미범주를 사용하는 "설명"의 경우 저빈도 명사보다 고빈도 명사의 경우 더 높은 빈도를 보였다. 그리고 분류명사와 속성의 의미범주가 연령에 따라 증가하였고 오류반응이 연령이 증가하면서 적게 나타났다. 따라서 명사 정의하기에서 명사의 출현빈도가 중요한 영향력을 미치는 것을 알 수 있었다.

문헌빈도와 장서빈도를 이용한 kNN 분류기의 자질선정에 관한 연구 (A Study on Feature Selection for kNN Classifier using Document Frequency and Collection Frequency)

  • 이용구
    • 한국도서관정보학회지
    • /
    • 제44권1호
    • /
    • pp.27-47
    • /
    • 2013
  • 이 연구에서는 자동 색인을 통해 쉽게 얻을 수 있는 자질의 문헌빈도와 장서빈도를 이용하여 자동분류에서 자질 선정 기법을 kNN 분류기에 적용하였을 때, 어떠한 분류성능을 보이는지 알아보고자 하였다. 실험집단으로 한국일보-20000(HKIB-20000)의 일부를 이용하였다. 실험 결과 첫째, 장서빈도를 이용하여 고빈도 자질을 선정하고 저빈도 자질을 제거한 자질선정 방법이 문헌빈도보다 더 좋은 성능을 가져오는 것으로 나타났다. 둘째, 문헌빈도와 장서빈도 모두 저빈도 자질을 우선으로 선정하는 방법은 좋은 분류성능을 가져오지 못했다. 셋째, 장서빈도와 같은 단순빈도에서 자질 선정 구간을 조정하는 것이 문헌빈도와 장서빈도의 조합보다 더 좋은 성능을 가져오는 것으로 나타났다.

한국어 음소결합확률 계산기 개발연구 (A Study of Development for Korean Phonotactic Probability Calculator)

  • 이찬종;이현복;최훈영
    • 한국음향학회지
    • /
    • 제28권3호
    • /
    • pp.239-244
    • /
    • 2009
  • 본 연구는 현대 한국어 단어의 말소리가 결합하는 음소결합확률 (Phonotactic Probability)을 예측하는 계산기 엔진 개발에 관한 연구이다. 한국어 음소결합확률계산기 (이하, KPPC)는 첫째로, 한국어의 주어진 단어에서의 음소와 그 음소의 음소결합의 빈도를 예측하여 말소리가 단어내의 특정위치에서 특정 분절음이 나타나는 빈도 값, 두 음소간의 결합의 빈도값, 그리고 세 음소간의 결합의 빈도 출현률을 예측하여 계산한다. 둘째로 한국어의 주어진 단어에서 말소리 하나만 다르면서 실제로 존재할 수 있는 근접밀도 (neighborhood density)의 값을 계산한다. University of Kansas에서 개발된 음소결합계산기는 영어 20,000단어의 D/B를 대상으로 위치별 분절음빈도와 두 음소간의 음소결합률 빈도를 컴퓨터가 읽을 수 있는 발음기호를 통해서만 가능하다. 본 연구에서는 분절음빈도와 두 음소간의 빈도뿐만 아니라 세 음소간의 결합률 빈도와 근접밀도율을 예측할 수 있고 입력할 때 발음기호뿐만 아니라 단어를 입력하면 확률값을 얻을 수 있다. 이 엔진은 67,284단어의 한국어 표준발음을 D/B로 구축하여 고빈도 음소결합확률, 저빈도 음소결합확률, 고빈도 근접밀도, 저빈도 근접밀도의 값을 예측할 수 있다.

고빈도어를 이용한 복합명사 색인어 추출 방안 (The Generation Methods of Composition Noun For Efficient Index Term Extraction)

  • 김미진;박미성;장혁창;최재혁;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.121-129
    • /
    • 1998
  • 정보검색이나 자동색인 시스템에서는 정확한 색인어의 추출이 시스템의 성능을 좌우하게 된다. 따라서 정확한 색인어의 추출이 매우 중요하다. 본 논문에서는 정보 검색시에 보다 정확한 문서를 찾아줄 수 있도록, 출현 고빈도어를 이용하여 효율적인 색인어 추출을 위한 합성 명사 생성방안을 제시한다. 이를 위하여 문서 내에서 출현 빈도가 높은 명사, 즉 상위 $30%{\sim}40%$의 고빈도 명사에 합성 및 분해 규칙을 적용하여 합성명사 색인어를 추출한다. 또한 본 논문에서 제시한 상위 $30%{\sim}40%$ 고빈도 명사합성에 대한 타당성을 검증하기 위하여 적절한 명사합성 빈도를 구한다. 제안한 방법을 적용한 결과 300어절 이하의 짧은 문서는 출현빈도 상위 30%까지의 명사를 합성했을 경우 저빈도 누락이 작았고 300어절 이상의 문서는 출현빈도 40%까지 합성하면 저빈도 누락이 상당히 줄어듦을 알 수 있었다. 그리하여 전체 색인어의 개수를 줄였고 색인어의 정확률을 높였다.

  • PDF

범주화 과제에서의 한글단어 빈도효과 (Hangul Word-Frequency in Semantic Categorization Task)

  • 조중열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.351-358
    • /
    • 1999
  • 범주화과제를 사용한 두 실험에서 단어 빈도가 단어의 의미를 처리하는데 영향을 주는지를 알아보았다. 두 실험에서 사용된 자극은 두 글자의 한글이었는데, 실험 1에서는 사례와 목표자극은 두 번째 글자의 종성에서만 달랐고(예, 범주: 관직: 사례: 시장; 목표자극: 시작), 실험 2에서는 첫 번째 글자의 종성에서만 달랐다(예, 범주: 관직: 사례: 시장; 목표자극: 심장). 실험 1에서는 통제자극보다 저빈도 목표자극의 오반응이 더 많았고, 고빈도 사례의 반응시간이 더 길었다. 실험 2에서는 고빈도 사례-저빈도 목표자극 조건이 통제조건보다 반응시간이 더 길었다. 이 결과는 이중경로모형(Jared & Seidenberg, 1991)을 지지한다고 볼 수 있다. 이 결과들은 음운 정보와 시각 정보의 사용은 단어의 빈도에 의존하며, 특히 음운정보의 활성화는 필연적인 과정이 아니라 선택적인 것을 시사한다.

  • PDF

확률강우량 산정을 위한 대규모 기후 앙상블 모의자료의 적용 (Application of a large-scale climate ensemble simulation database for estimating the extreme rainfall)

  • 김영규;손민우
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.333-333
    • /
    • 2022
  • 본 연구는 저빈도·고강도의 확률강우량 산정을 위해, 대규모 기후 앙상블 모의실험 기반으로 생성된 d4PDF(Data for Policy Decision Making for Future Change)를 적용하는 것을 목적으로 수행되었다. 또한, d4PDF 를 이용하여 산정된 확률강우량과 관측자료 및 빈도해석을 통해서 산정된 확률강우량을 비교함으로써 빈도해석의 적용에 따라 발생하는 불확실성을 분석하였다. 이와 같은 연구는 용담댐에 위치한 금산, 임실, 전주, 장수 관측소를 대상으로 수행되었다. d4PDF 자료는 총 50 개의 앙상블로 구성되어 있으며, 하나의 앙상블은 60 년 동안의 기상자료를 제공하기 때문에 한 지점에서 3,000 개의 연 최대 일 강우량을 수집 및 활용하는 것이 가능했다. 이와 같은 d4PDF 의 특징을 토대로 본 연구는 빈도해석 방법을 적용하지 않고, 3000 개의 연 최대 일 강수량을 비모수적 접근법(Non-parametric approach)에 따라 규모별로 나열하여, 10 년부터 1000 년의 재현기간을 갖는 확률강우량을 산정했다. 그 후, 관측 자료와 Gumbel 및 GEV(General extreme value) 분포를 토대로 산정된 확률강우량과의 편차를 산정하였다. 그 결과, 재현기간과 관측 기간의 차이가 증가할수록 이 편차가 증가하였으며, 이 결과는 짧은 관측 기간과 빈도해석의 적용은 재현기간이 증가할수록 신뢰하기 어려운 확률강우량을 제시한다는 것을 의미한다. 반면에, d4PDF 는 대규모 표본을 이용함으로써 이와 같은 불확실성을 최소화시켜 합리적인 저빈도·고강도의 확률강우량을 제시하였다.

  • PDF

경피신경전기자극의 빈도-강도가 만성 요통 환자의 요통장애지수와 유연성에 미치는 영향 (Effect of Frequency and Intensity of Transcutaneous Electrical Nerve Stimulation on Patients with Chronic Low Back Pain)

  • 박정호;송브라이언병
    • 한국콘텐츠학회논문지
    • /
    • 제12권6호
    • /
    • pp.361-370
    • /
    • 2012
  • 이 연구의 목적은 경피신경전기자극을 저빈도-저강도, 저빈도-고강도, 고빈도-저강도, 고빈도-고강도 네 개의 치료조건으로 나누어 만성요통환자에게 적용하였을 때 각기 다른 주파수 빈도와 강도가 만성요통환자의 미치는 영향을 알아보는 것이다. 연구대상은 평균연령 39.19(${\pm}12.96$)세, 발병기간 8.57(${\pm}3.07$)개월인 요통환자 32명이었다. 치료기간은 2주 횟수는 총 10회로 1일 1회 15분간 시행하였으며 치료부위는 통증이 가장 심한 요추주변 부위에 시행하였다. 치료 전 후의 변화를 평가하기 위해 요통정도(요통장애지수)와 요추부 유연성을 측정하였다. 각 군간 윌콕슨, 맨-휘트니 검정을 하였고, 통계적 유의성은 p< .05로 하였다. 결과는 다음과 같다. 네 군 모두 실험 후 요통장애지수와 요추부 유연성에 유의한 결과가 나왔으며, 저빈도군에서는 고강도가, 고빈도군에서는 고강도가 보다 효과적이었다. 고빈도-고강도가 요통장애지수와 요추부 유연성에 유의한 차이는 없었지만 가장 효과적이었다.

작업기억 부하가 단어빈도에 미치는 효과 (The Effects of Working Memory Load on Word Frequency)

  • 이창환;오지향;편성범;임희석
    • 한국산학기술학회논문지
    • /
    • 제10권3호
    • /
    • pp.567-571
    • /
    • 2009
  • 본 연구는 단어 재인에서 작업 기억의 역할을 규명하기 위하여 진행되었다. 단어 재인에서의 작업 기억 역할 규명을 위하여 단어 빈도와 직업 기억 부담을 조절한 명명 과제 실험을 실시하였다. 실험 결과 단어 빈도는 작업 기억 부담에 영향을 받는 것으로 분석되었다. 작업 기억의 부담은 고빈도 단어 재인에서보다 저빈도 단어 재인에서 더 높은 영향을 미쳤다. 이러한 결과는 작업 기억이 저빈도 단어 재인에서 더 많은 영향을 갖음을 시사하는 것이다.

PCSWMM을 이용한 분산형 우수관리에 의한 홍수 저감 효과 평가 (Evaluation of flood reduction by decentralized stormwater management using PCSWMM)

  • 진영규;강태욱;서효원;이상호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.315-315
    • /
    • 2021
  • 저영향개발은 녹색 기반시설을 이용한 침투, 여과, 저류, 지체 등의 효과를 달성하는 구조적 방식과 집중된 우수 배제 방식을 분산시키는 비구조적 방식이 있다. 국내에서는 저영향개발을 주로 시범사업 수준에서 침투트렌치, 식생수로, 투수성 포장과 같은 일부의 요소기술만 적용하고 있는 실정으로, 비구조적 방법을 이용한 분산식 우수배제 방식을 도입한 사례는 거의 없다. 본 연구에서는 PCSWMM을 이용하여 송산 그린시티 개발 사업에 기존의 집중형 우수 배제 방식과 비구조적 방식을 포함한 저영향개발을 각각 도입하여 홍수 및 침수 저감 효과를 검토하였다. 본 연구에서는 송산 그린시티에 저영향개발 기법을 고려하면서 기존 4개의 주 수로에 2개의 소규모 수로를 추가적으로 고려하였다. 또한, 우수관거는 연장이 길어짐에 따라 관거의 규모가 커지므로 유역 유출부에 인접한 지역은 직접 우수 배제가 되도록 하였고, 우수의 배제 방향을 분산시킴으로써 관거의 규모가 비대해지지 않도록 하였다. 홍수 및 침수 저감 효과는 50년 빈도 확률 강우량과 100년 빈도 확률강우량을 적용하여 검토하였다. 그 결과, 적용된 집중형 우수 배제 방식의 경우에는 50년 빈도 확률강우량 조건에서 48 ha, 100년 빈도 확률강우량에서는 81 ha가 침수되는 것으로 모의가 되었다. 반면, 분산형 우수배제 방식을 포함한 저영향개발을 반영할 경우, 50년 빈도 확률강우량에서 6 ha, 100년 빈도 확률강우량 조건에서는 18 ha가 침수되는 것으로 모의가 되었다. 즉, 분산형 빗물관리를 계획함에 따라 홍수 저감의 효과가 나타나는 것으로 분석되었다.

  • PDF

북서태평양에서 열대 저기압 발생빈도의 십년간 변동 특성 (Interdecadal Variation of Tropical Cyclone Genesis Frequency over the Western North Pacific)

  • 최기선;김백조;이성로;박종길
    • 한국방재학회 논문집
    • /
    • 제9권6호
    • /
    • pp.31-39
    • /
    • 2009
  • 본 연구에서는 북서태평양상의 기후학적 평균 열대 저기압 발생 자료를 이용하여 이 해역의 북서구역과 남동구역에서의 열대 저기압 발생빈도의 시간변화에서 십년간 변동성을 보이고 반대 위상으로 존재함을 밝혔다. 열대 저기압 발생빈도는 북서구역에서 1980년대 중반 이후부터 최근까지(1986-2005) 증가하는 반면에, 남동구역에서 1951년부터 1970년대 초반(1951-1970)까지 높게 나타났다. 1986-2005년과 1951-1970년 사이의 차이점을 분석한 결과는 다음과 같다. i) 연직바람시어와 해수면 온도의 경우, 1986-2005년 동안에는 북서구역에서, 1951-1970년의 기간에는 남동구역에서 음의 연직시어와 양의 해수면 온도 아노말리를 나타내고 있었다. ii) 열대 저기압 이동빈도를 분석해 본 결과, 북서구역에서 발생한 열대 저기압들 중에서 1986~2005년 동안에는 주로 남중국해에 영향을 주는 빈도가 높았던 반면, 1951-1970년 동안에는 필리핀 동쪽 해상으로부터 동중국해를 지나 한국 및 일본을 통과하는 빈도가 높았다. 남동구역에서 발생한 열대 저기압들의 경우에 대략 $150^{\circ}E$를 기준으로 이동빈도의 공간분포가 동서로 나눠질 수 있다. 1951-1970년 동안의 열대 저기압들은 150oE의 서쪽에서, 1986-2005년 동안의 열대 저기압들은 $150^{\circ}E$의 동쪽에서 주로 이동하는 특성을 보였다. 특히, 1951-1970년 동안에 발생한 열대 저기압들은 필리핀의 동쪽 해상으로부터 남중국해 및 남중국 방향으로 이동하는 빈도가 높았다. iii) 두 기간 사이에 열대 저기압 이동빈도의 이러한 차이는 500 hPa 아노말리 기압패턴에 그 원인이 있다. 특히 1951-1970년 동안에는 동아시아 대륙에 저기압성 순환의 아노말리가 형성되어 필리핀 동쪽해상으로부터 동아시아 해안을 따라 남풍 아노말리가 강화되었다. 이 남풍 아노말리는 열대 저기압이 필리핀 동쪽해상으로부터 동아시아 해안을 따라 이동하기 쉽게 하는 지향류의 역할을 하였다.