• 제목/요약/키워드: 어랑 분포

검색결과 460건 처리시간 0.049초

구문분석 말뭉치를 이용한 문법 관계의 선호 체언 어휘와 의미 유형 연구 (A Treebank-Based Approach to Preferred Nominal Words in Grammatical Relations and their Semantic Types)

  • 홍정하
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.35-41
    • /
    • 2008
  • 이 논문은 각 문법 관계(grammatical relation)에서 선호되는 체언 어휘를 파악하고, 이 어휘들의 의미적 유형 및 그 위계를 파악하는 것이 목적이다. 이를 위해 80만 어절의 21세기 세종계획 구문분석 말뭉치에서 그 분포를 추출하고, 통계적 검증을 통해 각 문법 관계에서 선호되는 체언 어휘를 선별한다. 이 연구에서 관찰하는 문법 관계는 주어, 목적어, 용언수식어로 하며, 이들 문법 관계에서 선호되는 어휘 추출 대상 품사는 대명사, 고유명사, 일반명사로 한다. 한정성의 강도에 따라 주어 분포 경향이 나타나며, 이에 따라 대명사 > 고유명사 > 일반명사 순으로 주어 분포 경향이 나타난다. 그러나 일반적 예측과 다르게 한정성의 강도가 더 강한 것으로 알려진 대명사가 고유명사보다 목적어와 용언수식어에서 분포 경향이 더 강하여, 일반명사 > 대명사 > 고유명사의 순으로 분포 경향이 나타난다. 대명사, 고유명사, 일반명사는 공통적으로 주어에서는 사람 지시어, 목적어에서는 사물과 장소 지시어, 그리고 용언수식어에서는 시공간 표현이 선호되어 분포한다. 특히 대명사는 각 문법기능에서 인칭대명사의 경우 인칭에 따라, 그리고 지시대명사의 경우 원근칭에 따라 선호도의 차이를 보인다. 이러한 체언 어휘의 의미적 분포 특성은 문법 관계에 통사적 기능 외에도 의미적 경향이 반영된 것으로 고려될 수 있다.

  • PDF

형상모수를 고려한 소프트웨어 신뢰성 비용 모형에 관한 비교 연구 (The Comparative Software Reliability Cost Model of Considering Shape Parameter)

  • 김경수;김희철
    • 디지털융복합연구
    • /
    • 제12권3호
    • /
    • pp.219-226
    • /
    • 2014
  • 본 연구에서는 소프트웨어 제품 테스팅 과정에서 고장 수명분포의 형상모수를 고려한 소프트웨어 신뢰성 비용 모형에 대하여 연구 하였다. 신뢰성 분야에서 많이 사용되는 어랑 분포와 로그-로지스틱 모형을 이용한 형상모수를 반영한 문제를 제시하였다. 소프트웨어 고장모형은 유한고장 비동질적인 포아송과정을 이용하고 모수추정법은 최우추정법을 이용 하였다. 따라서 본 논문에서는 형상모수를 고려한 소프트웨어 비용모형 분석을 위하여 소프트웨어 고장 시간 자료를 적용하여 비교 분석하였다. 본 연구에서 사용된 어랑 분포와 로그-로지스틱분포에 근거한 소프트웨어 비용 모델을 비교한 결과 어랑 모형은 최적의 소프트웨어 방출 시간을 예측 할 수 있지만 로그-로지스틱 모형은 방출시간을 예측 할 수 없기 때문에 로그-로지스틱 보다 어랑 모형이 보다 효율적으로 나타나고 있다. 이 연구를 통하여 소프트웨어 개발자들은 소프트웨어 개발 비용을 파악 하는데 어느 정도 도움을 줄 수 있을 것으로 사료된다.

검색엔진에서 일간질의 어분포의 정상성에 관한 연구 (On Regularity of Daily Distribution of Queries in Search Engine)

  • 박상규;이찬규;윤경현;김성희;이준호
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.255-265
    • /
    • 2007
  • 하루에도 수백만 건 이상의 방대한 질의어가 입력되는 검색엔진을 통해 인터넷 검색 패턴을 분석하는데 활용될 수 있는 질의어 분포의 정상성을, Pareto 분포와 Zipf 모형을 이용해 검토하였다. 실제2주일간의 일간 검색어 분포를 Pareto 모형으로 적합 시킨 결과, 그 기울기가 1.33에서 1.34 정도로 일관되게 측정되고 있어 Pareto 분포를 이용해 일간질의어 분포의 정상성을 평가할수 있음을 제시하였다. 이런 연구결과는 사회적 관심사와 그 변동 흐름을 해석하는데 보다 객관적이며, 효율적인 자료를 제공해 줄 수 있을 것이다.

어랑 분포를 이용한 NHPP 소프트웨어 신뢰성장 모형에 관한 연구 (An Approach for the NHPP Software Reliability Model Using Erlang Distribution)

  • 김희철;최유순;박종구
    • 한국정보통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.7-14
    • /
    • 2006
  • 비동질적인 포아송 과정에 기초한 모형들에서 잔존 결함 1개 당 고장 발생률은 일반적으로 상수, 혹은 단조증가 및 단조 감소 추세를 가지고 있다. 본 논문에서는 잔존 결함 1개당 고장 발생률이 증가추세를 가진 어랑 분포를 이용한 어랑 모형을 제안하였다. 고장 간격시간으로 구성된 실측자료를 이용하여 기존의 모형과 어랑 모형의 모수 추정을 실시하였다. 어랑 모형의 형상모수를 선택하기 위하여 (누적)분포적합도 검정을 사용하였고 이 자료들에서 어랑 모형의 제안과 비교를 위하여 산술적 및 라플라스 검정, 적합도 검정, 편의 검정 등을 이용하였다.

베링해 명태의 초기 생활기 분포

  • 김두남;양원석;김종빈;최석관;조현수;김진영;박경동
    • 한국어업기술학회:학술대회논문집
    • /
    • 한국어업기술학회 2000년도 춘계수산관련학회 공동학술대회발표요지집
    • /
    • pp.342-343
    • /
    • 2000
  • 대부분의 어류는 난과 자치어기를 지나 성어가 되면서 어장에 가입되므로 어란과 자치어의 분포밀도는 성어자원량을 파악하는데 중요하다. 일반적으로 물리적 환경 즉 수온과 해류는 어류 자치어의 분포, 성장 및 생존에 영향을 미치는 주된 요인으로 표층수온은 난의 발달과정을 조절하고 해류는 유영력이 미약한 자치어의 분포와 출현량에 영향을 미친다. (중략)

  • PDF

한국어 부사어의 분류와 분포 제약

  • 채희락
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.95-96
    • /
    • 2001
  • 문장에서 술어를 수식하는 대표적인 표현은 부사어이다. 부사어는 일반적으로 문장 구성에서 핵심적 역할을 하지 않는 첨가어(adjuncts)이기 때문에 핵심적인 역할을 하는 보충어(complements)에 비해 상대적으로 연구가 덜 이루어진 분야이다. 그렇지만 부사어는 피수식어의 의미를 구체화/한정하는 기능을 하기 때문에 정확한 의사소통을 위해서는 반드시 필요한 요소이며 어순, 호응(concord)등의 통사적 현상과도 밀접한 관련이 있다. 이 연구의 일차적 목적은 이러한 부사어를 통사적, 의미적 기준에 의해 정확하게 분류하고 그들의 분포제약을 밝히는 것이다. 그 다음으로, 부사어와 관련된 통사 현상으로, 부사어와 피수식어의 공 기(co-occurrence)관계 및 부사어와 술어 어미의 호응 관계에 대한 분석을 제공하려고 한다. 부사어는 통사적인 기준과 의미적인 기준으로 분류할 수 있다 (손남익 1995, 김경훈 1996, 임유종 1998). 통사적 기준으로는 단어나 구를 수식하는 성분부사와 문장을 수식하는 문장 부사로 나누는 방법과 위치에 대한 제약이 있느냐 없느냐에 따라 제약부사와 자유부사로 나 누는 방법이 있다. 이 두 통사론적 기준에 의해 분류되는 부사들은 서로 어떤 상관관계를 보이고 있는지 살펴 볼 것이다. 일반적으로 문장부사는 문두에 놓여야 한다는 위치적 제 약 이 있기 때문에 제약부사로 분류된다. 의미적 기준으로 부사어를 분류할 수도 있는데, 시간/ 공간 부사어, 양태/정도 부사어 등으로 나눌 수 있다. 의미적 기준에 의해 분류된 부사어는 통사적 기준에 의해 분류된 것들과는 어떤 상호 관련성을 맺고 있는지 살펴 볼 것이다. 일 반적으로 시간부사와 장소부사는 자유부사에 속하며 양태부사와 정도부사는 제약부사에 속 한다. 부사어와 피수식 요소와의 통사적 공기 관계 및 의미적 관계 그리고 그와 관련된 문 법 현상도 연구의 대상이 된다. 예를 들어, 자유로운 어순을 가진 부사들이지만 “*순이는 빨리 과연 달린다”에서 볼 수 있는 종류의 분포적 특성을 알아 볼것이다 (심재기 1982, 송 철의 1989). 또한 “길이/*길게 빛나다”와 “*길이/길게 드리워졌다”와 같은 대조에서 나타나는 통사, 의미적 기능의 상관 관계 및 제약들의 상호 작용도 살펴 볼 것이다.

  • PDF

의미 경계의 현실화를 위한 공기정보의 자동 군집화 (Automatic word sense clustering using collocation for practical sense boundaries)

  • 신사임;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.559-561
    • /
    • 2004
  • 본 논문에서는 다의어의 현실적인 의미 분포의 결정에 대해 이야기 하고자 한다. 수동으로 구축한 의미체계인 사전이나 시소러스들은 그 의미구분의 경개가 모호하고 비현실적인 부분이 많아서 언어처리 시스템의 적용에 문제점으로 지적되고 있다. 그러므로, 본 연구에서는 대용량 코퍼스에서 추출한 공기정보와 자동 군집화 방법들을 사용하여 실질적인 다의어의 의미 경계를 발견하는 방법을 제안하였다. 수동 구축된 사전과 코퍼스 기반 사전의 다의어 의미 분포와 비교해 본 결과, 본 논문에서 제안한 방법의 결과가 코퍼스 기반 사전의 의미 분포와 매우 유사한 결과를 보이는 것을 확인할 수 있었다.

  • PDF

일한 기계번역에서 조동사 "-reru, -rareru"의 번역처리 (Translation of Auxiliary Verbs "-reru,-rareru" in Japanese-Korean Machine Translation)

  • 김정인;문경희;이종혁;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.261-268
    • /
    • 1997
  • 일본어에서 조동사 "-reru, -rareru"는 '피동', '가능', '자발', '존경' 등의 의미로 두루 쓰이고 있다. 일한 번역에서 이들은 여러 가지 대역어로 나타나며 일정한 규칙이나 패턴을 취하지 않으므로, 기계 번역시 조동사 "-reru, -rareru"는 그 처리가 쉽지 않다. 더구나, 조동사 "-reru, -rareru"는 일본어에서 높은 빈도로 등장하여 무시하기 어렵고 의미별 분포가 고루 퍼져 있어, 대표적 대역어인 "-아/어/여 지다. -되다" 등으로만 대응시킬 경우의 번역 에러는 의외로 치명적이다. 따라서, "-reru, -rareru"의 번역을 고려한 특수 처리를 행할 필요가 있다. 먼저, 본 논문에서는 조동사 "-reru, -rareru"가 포함된 아사히 신문 가사의 5,800여 문장을 대상으로 각각의 의미에 대한 분포 및 한국어 대역어의 빈도를 조사하였다. 대역어는 크게 8종류의 형태로 나누었으며 각 동사별로 "-reru, -rareru"와 결합된 경우의 의미 출현 빈도를 참고하여 대응 가능한 대역어 형태들을 미리 결정하였다. 그리고, 대역어가 여러 개 존재하는 경우는 패턴 매칭을 통하여 적절한 대역어를 선택할 수 있도록 하였다. 그 결과, 약 87%의 "-reru, -rareru"가 적절한 대역어로 번역되어, 본 논문에서 제시한 의미 출현 빈도에 기반한 각 동사별 대역어 형태 결정 방법이 "-reru, -rareru"의 다의성 해소에 유효하다고 판단된다.

  • PDF

아산만 해역의 부유성 난과 자치어의 분포 (Distribution of Ichthyoplankton in Asan Bay, Korea)

  • 김용억;한경호;강충배
    • 한국수산과학회지
    • /
    • 제27권5호
    • /
    • pp.620-632
    • /
    • 1994
  • 아산만 주변 해역의 부유성 난과 자치어 분포를 조사하기 위하여, 1991년 4월, 7월, 10월 및 1992년 1월 4회에 걸쳐서 RN 80Net를 이용하여 부유성난과 자치어를 표층 채집하여 분류 동정하였다. 본 해역에서 출현한 부유성 난은 민어속 어류, 멸치, 동갈양태속어류 및 기타로 분류되었는데, 조사 기간중 민어속 어류의 난이 전체 어란 출현량의 $97.70\%$를 차지하여 우점종으로 나타났다. 자치어는 총 23개 분류군이 출현하였는데, 조사기간중 망둑어과 어류는 7종이 출현하여 전체 자치어 출현량의 $32.84\%$를 차지하여 극우점종으로 나타났으며, 까나리가 $16.69\%$를 차지하여 우점종으로 나타났다. 그 이외에도 뱀장어, 민어속어류, 덕대 및 멸치가 주요 출현종을 이루었다. 이들 6개 분류군은 자치어 출현량의 $90.40\%$를 차지하였다. 본 해역의 내만쪽에서는 담수의 영향으로 아산호에 인접한 정점에서는 자치어 분포에 큰 영향을 미치는 것으로 나타났으며, 외해쪽 보다는 이들 기수 지역에서 많은양이 출현하여 부유성 난과 차지어 분포에 영향을 미치는 것으로 나타났다.

  • PDF

임자도 주변해역의 자치어 분포

  • 전송미;조영철;최옥인;이성환
    • 한국어업기술학회:학술대회논문집
    • /
    • 한국어업기술학회 2000년도 추계수산관련학회 공동학술대회발표요지집
    • /
    • pp.300-301
    • /
    • 2000
  • 우리나라 서해안은 조간대가 넓게 발달하여 있고 조차가 매우 크므로 물의 혼합이 잘 이루어져 먹이가 풍부하며, 탁도가 높아 포식의 위험이 적어 어류의 산란장이나 생육장으로 중요한 역할을 하고 있다. 어류는 난에서 부화하여 자치어기를 거쳐 성장하면서 성어가 되고 어업에 가입이 된다. 어류의 초기 발생 시기에는 주변해역의 환경요인에 영향을 가장 많이 받는 시기로 자치어 생존율은 어류 자원의 크기를 결정짓는다(May,1974). 따라서 어류 자원량 추정과 미래 자원량을 예측하기 위해서는 자치어의 출현량과 분포에 관한 연구가 중요한 정보가 된다. (중략)

  • PDF