• 제목/요약/키워드: 선택 빈도

검색결과 859건 처리시간 0.028초

일한 기계번역에서 조동사 "-reru, -rareru"의 번역처리 (Translation of Auxiliary Verbs "-reru,-rareru" in Japanese-Korean Machine Translation)

  • 김정인;문경희;이종혁;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.261-268
    • /
    • 1997
  • 일본어에서 조동사 "-reru, -rareru"는 '피동', '가능', '자발', '존경' 등의 의미로 두루 쓰이고 있다. 일한 번역에서 이들은 여러 가지 대역어로 나타나며 일정한 규칙이나 패턴을 취하지 않으므로, 기계 번역시 조동사 "-reru, -rareru"는 그 처리가 쉽지 않다. 더구나, 조동사 "-reru, -rareru"는 일본어에서 높은 빈도로 등장하여 무시하기 어렵고 의미별 분포가 고루 퍼져 있어, 대표적 대역어인 "-아/어/여 지다. -되다" 등으로만 대응시킬 경우의 번역 에러는 의외로 치명적이다. 따라서, "-reru, -rareru"의 번역을 고려한 특수 처리를 행할 필요가 있다. 먼저, 본 논문에서는 조동사 "-reru, -rareru"가 포함된 아사히 신문 가사의 5,800여 문장을 대상으로 각각의 의미에 대한 분포 및 한국어 대역어의 빈도를 조사하였다. 대역어는 크게 8종류의 형태로 나누었으며 각 동사별로 "-reru, -rareru"와 결합된 경우의 의미 출현 빈도를 참고하여 대응 가능한 대역어 형태들을 미리 결정하였다. 그리고, 대역어가 여러 개 존재하는 경우는 패턴 매칭을 통하여 적절한 대역어를 선택할 수 있도록 하였다. 그 결과, 약 87%의 "-reru, -rareru"가 적절한 대역어로 번역되어, 본 논문에서 제시한 의미 출현 빈도에 기반한 각 동사별 대역어 형태 결정 방법이 "-reru, -rareru"의 다의성 해소에 유효하다고 판단된다.

  • PDF

주가지수선물의 주문 및 거래변수가 호가스프레드에 미치는 영향 (Effect of Order and Trading Variables in KOSPI200 Futures on Bid-Ask Spread)

  • 김영규;신년수
    • 재무관리연구
    • /
    • 제17권1호
    • /
    • pp.181-202
    • /
    • 2000
  • 본 연구는 지수선물 시장에서 호가스프레드에 영향을 줄 수 있는 요인변수를 탐색하였다. 호가스프레드는 1996년 5월 3일부터 1997년 7월 31일까지 일중 4시간 5분의 거래시간을 5분 간격으로 나누어 49개의 시간대별 잔량을 구하여 호가스프레드를 계산하였으며, 요인변수는 주문 거래자료를 이용하여 산출하였다. 분석결과는 다음과 같다. 첫째로, 호가스프레드 측정결과 개장직후 10분과 폐장직전 10분간의 호가스프레드가 다른 시간대보다 크게 나타났다. 우리나라 주가지수선물시장에서도 이상의 두 시간대에서는 거래자들이 현저히 높은 정보불균형이 있었고, 역선택과정이 심한 것으로 보여진다. 이는 McInish와 Wood(1992) 및 Jang과 Lee(1995) 그리고 Daigler(1997)의 U자형 패턴과 유사하게 나타났다. 둘째로, 거래빈도, 총주문량은 호가스프레드에 유의적인 음(-)의 영향을 주어 호가스프레드를 줄이는데 정보적 역할을 하고 있었던 것으로 생각된다. 그리고 주문빈도 및 변동성과 수익률이 모두 호가스프레드에 유의적인 양(+)의 영향을 주고 있었다. 회귀분석결과 관찰자료로 총주문량, 거래빈도가 유동성변수로서 의미가 있었고, 묵시적 거래비용을 줄여줄 수 있을 것이라 보여진다. 한편 주문빈도는 정보탐색을 위한 허수주문으로 여겨진다. 우리나라 선물시장에서는 투자자들이 가격 변동성에 대한 보상을 원하고 있었다. 일반적으로 투자자들은 가격위험하에서는 거래 체결을 원하지 않기 때문에 이러한 점이 호가스프레드를 커지게 하였던 원인으로 보여진다.

  • PDF

다변량 분석 기법을 활용한 동질 지역 구분 (Identification of Homogeneous Regions based on Multivariate Techniques)

  • 남우성;김태순;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.1568-1572
    • /
    • 2007
  • 지역빈도해석은 우리나라와 같이 자료 기간이 짧은 경우 지점빈도해석보다 더 정확한 확률강우량을 산정할 수 있는 기법이다. 지역빈도해석을 통한 확률강우량 산정 결과는 수문학적으로 동질한 지역의 구분 결과에 따라 달라진다. 지역을 구분할 때에는 강우에 영향을 미치는 다양한 변수들이 사용될 수 있다. 변수의 유형과 개수가 지역 구분의 효율성을 좌우하기 때문에 활용 가능한 모든 변수들의 정보를 요약할 수 있는 변수들을 선택하는 것이 지역 구분의 효율성 면에서 유리하다고 할 수 있다. 이런 면에서 지역 구분의 효율성을 증대시킬 목적으로 다변량 분석 기법이 활용될 수 있다. 본 연구에서는 주성분 분석, 요인 분석, Procrustes analysis와 같은 다변량 분석 기법을 활용하여 42개의 강우 관련 변수들을 33개의 변수로 줄일 수 있었다. 분석 결과 변수 개수 감소로 인한 정보 손실은 크지 않은 것으로 나타났다. 따라서 이러한 기법에 의한 변수 차원의 축소는 지역 구분의 효율성 향상에 기여할 수 있는 것으로 판단된다. 선정된 변수들을 바탕으로 군집해석을 수행하여 지역을 구분하였고, L-모멘트에 근거한 이질성척도(H)를 활용하여 구분된 지역의 동질성을 검토하였다. 또한 L-모멘트에 근거한 적합성 척도(Z)를 적용하여 구분된 지역에 적합한 확률분포형을 선정하였고, 선정된 적정 확률분포형을 바탕으로 각 지역에 대한 성장 곡선(growth curve)을 유도하였다.

  • PDF

특수 문자 및 단어 빈도 비율을 이용한 스팸 필터링 방법 (A Spam Filtering Method using Frequency Distribution of Special Letter and Frequency Ratio of Keyword)

  • 이성진;백종법;한정석;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.280-283
    • /
    • 2011
  • 인터넷 환경에서 무차별적으로 유통되는 스팸 문서로 인한 사회적 문제가 커져 가고 있는 가운데 스팸문서를 차단하기 위한 활발한 연구들이 이루어지고 있다. 이 가운데 대표적인 연구는 자질어를 이용한 기계학습 기반의 스팸 차단 기술이다. 그러나 이 방법은 미리 선택된 자질어로만 구성된 분류 모델을 사용하기 때문에 Term Spamming(단어 조작에 의한 스팸 차단 행위)에 취약하며, 스팸 차단의 성능과 학습 소요 시간이 선택된 자질어의 품질과 수에 민감하게 영향을 받는다는 문제점이 있다. 본 논문에서는 이러한 문제를 해결하기 위해 스팸 문서에서 등장하는 특수 문자의 빈도와 반복되는 단어의 특징을 이용한 스팸 탐지 방법을 제안한다. 제안 방법은 각 문서에서 등장하는 특수 문자의 비율과 최다 출현 단어의 반복 패턴을 정의하고 기계학습 알고리즘을 적용하여 스팸 분류 모델을 생성한다. 제안 방법의 성능 평가를 위해 E-mail 데이터와 블로그의 Post 데이터를 사용하여 자질어 기반의 스팸 차단 방법과 비교 실험을 진행하였다. 실험 결과 본 논문에서 제안하는 방법이 분류 정확도와 학습 소요 시간에 있어 우수한 성능을 보이는 것을 확인하였다.

보수행렬 검사를 통한 게임플레이의 전략적 오류 검출 (Strategic Errors Detection in Gameplay by the Inspection of Payoff Matrices)

  • 장희동
    • 한국게임학회 논문지
    • /
    • 제11권2호
    • /
    • pp.13-18
    • /
    • 2011
  • 시드마이어에 의하면 게임은 일련의 흥미로운 선택들이라고 하였다. 이는 흥미로운 선택들이 게임을 재미있게 만드는 주요 요인이란 의미이다. 본 논문에서는 게임에서 존재하는 흥미롭지 않는 선택대안을 게임플레이의 전략적 오류라 정의하고 이들 오류를 검출하는 방법을 제안하였다. 제안하는 방법은 게임이론에서 게임을 표현할 때 사용하는 보수행렬들을 검사하여, 게임플레이의 전략적 오류를 검출하는 방법이다. 이 방법은, 게임의 보수행렬들만 검사하는 경우에는, 적절한 대응전략이 없는 선택, 절대 우위 선택, 절대 열등 선택, 그리고 비슷한 보상이 이루어지는 선택들의 오류들을 검출할 수 있다. 그리고 게임의 보수행렬들과 대응하는 사용빈도율들을 함께 사용하는 경우에는, 추가적으로, 기대 보수가 매우 낮은 선택, 기대 보수가 매우 높은 선택, 사용확률이 매우 낮은 선택 그리고 사용확률이 매우 높은 선택들의 오류들을 검출할 수 있다.

스크린골프장 이용고객의 라이프스타일이 선택속성과 고객만족 및 재구매행동에 미치는 영향 (The Study on Effects of Screen Golfers' Lifestyle on Choice Attribute, Customer Satisfaction and Repurchasing Behavior)

  • 이태용;김수진;추나영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.245-246
    • /
    • 2011
  • 본 연구의 목적은 스크린골프장 이용고객의 라이프스타일이 선택속성과 고객만족 및 재구매행동과의 인과관계를 규명하고자 하는 것이다. 본 연구의 연구대상은 2010년 3월 1일부터 2010년4월 30일까지 약 2개월간 부산 경남지역에 소재하고 있는 스크린골프장 10곳의 이용고객을 모집단으로 선정하였으며, 한 곳당 40부씩 총 400부를 직접 업체를 방문하여 배포하고 최종 332명을 표집하였으며, 표본 추출방법은 편의표본추출법을 사용하였고 설문에 대한 응답은 자기평가기입법을 채택하였다. 이들 설문지 중 신뢰성이 떨어진다고 판단되는 42명의 설문지를 제외하고 총 290명을 유효 표본으로 선정하여 본 연구의 자료로 이용하였다. 본 연구에서는 SPSS Window 12.0 통계 패키지를 이용하여 요인분석과 신뢰도분석, 빈도 분석, 회귀분석을 실시하였다. 연구결과를 보면 다음과 같다. 첫째, 스크린골프장 이용고객의 라이프스타일이 선택속성에 유의한 영향을 미치는 것으로 나타났다. 둘째, 스크린골프장 이용고객의 선택속성은 고객만족에 유의한 영향을 미치는 것으로 나타났다. 셋째, 스크린골프장 이용고객의 선택속성은 재구매행동에 유의한 영향을 미치는 것으로 나타났다.

  • PDF

화주의 광양항 선택 결정요인에 관한 실증분석 (Empirical Analysis of the Determinants for Shippers' Selection of Gwangyang Port)

  • 최성희
    • 한국항만경제학회지
    • /
    • 제24권4호
    • /
    • pp.199-217
    • /
    • 2008
  • 항만선택 결정요인에 관한 선행연구를 정리해보면 매우 다양한 연구에서 결정요인들이 도출되었으며, 다수의 연구에서 주요요인들이 중복적으로 활용되고 있음을 알 수 있다. 그러나 연구자별로 조사대상의 입장과 선호도에 따라 다소 연구결과가 다르게 나타나고 있다. 따라서 화주들의 광양항 선택 결정요인을 도출하기 위해서는 문헌조사와 함께 적합한 실증적 연구와 분석이 요구되어 진다. 본 연구에서는 화주가 항만을 선택할 때 미치는 결정요인들을 선행연구를 통해 도출한 후, 도출된 결정요인들이 광양항을 이용하고 있는 화주들에게 미치는 영향을 실증적으로 분석하였다. 이를 위해 광양항 이용화주들의 지속적인 광양항 이용 여부를 종속변수로 설정하였고, 선행연구에서 도출된 항만선택 결정요인인 항만서비스, 항만시설, 항만입지, 항만비용 등을 독립변수로 설정하였다. 독립변수의 주요 요인을 살펴보면, 항만서비스 요인으로는 하역능력, 선박기항 빈도, 항만체선, CFS의 처리능력, 통관서비스, 항만정보 서비스 등을 변수로 설정하였다. 또한, 항만시설 요인으로는 항만의 규모, 적절한 하역장비의 보유, 화물의 손상 및 멸실 빈도 등을 변수로 설정하였으며, 항만입지 요인으로는 항만과의 접근성, 항만의 인지도 등을 설정하였다. 마지막으로 항만비용 요인으로는 내륙운송비, 항만시설사용료, 하역료, 무료장치기간, 인센티브 등을 변수로 설정하였다. 본 연구의 분석결과 광양항 이용 화주들은 항만서비스, 항만시설, 항만입지, 항만비용 요인에서 모두 광양항 선택에 영향을 미치고 있으며, 항만비용, 항만입지, 항만서비스, 항만시설 등의 순으로 중요도가 나타나고 있다. 이는 화주들이 항만시설보다는 항만비용과 항만의 입지, 항만서비스를 항만선택 시 주요한 고려요인으로 작용하고 있는 것으로 판단된다.

  • PDF

시각의 선택적 주의집중 분석을 위한 공간요소별 주시데이터 추출방법 (Method Extracting Observation Data by Spatial Factor for Analysis of Selective Attention of Vision)

  • 김종하;김주연
    • 감성과학
    • /
    • 제18권4호
    • /
    • pp.3-14
    • /
    • 2015
  • 본 연구는 지하철 입구 공공공간에서 피험자의 선택적 주의집중 분석을 위한 공간요소별 주시데이터 추출이다. 주시데이터의 추출방법 연구 결과는 다음과 같다. 첫째, 눈을 통해 획득되는 시각정보의 특성을 분석하는 과정에 중심와의 반경을 이용하여 주시범위를 설정하는 방식은 기존의 시지각 이론을 근간에 두면서 선택적 주의집중에 해당하는 주시데이터의 추출 결과를 객관화시킬 수 있는 방법을 정리했다. 둘째, 주시데이터 추출방법으로 기존에는 격자에 의한 빈도 분석이 주를 이루었는데 세부적 특성으로 공간정보를 분석함에 한계를 가지고 있었다. 이에 비해 선택적 주의집중 정도를 알 수 있는 주시데이터 추출방법은 공간에서 특정 요소에 시선이 얼마만큼 집중되는지를 분석해 낼 수 있었다. 선택적 주의집중을 통해 공간사용자의 주시특성을 분석하게 되면, 요소 맞춤형 주시데이터 추출이 가능하고, 이를 공간디자인이나 사인 배치에 활용하고 성과를 검증하는 것도 가능하다. 셋째, 공간요소에 대한 시간범위별 분석을 통해 특정 공간 요소를 주시한 데이터 특성을 시계열적으로 추적하여 정리하는 것이 가능했는데, 본 연구에서 대상으로 삼은 "해당 공간범위"의 결과를 보면, 남녀 모두 2분을 지난 시점에서 주의집중 정도가 급격히 떨어진 것을 확인할 수 있었다. 넷째, 주시 우위빈도를 통해 선택적 주의집중이 일어난 구역을 시간범위별로 분석하였는데, 성별에 따라 남자는 I시간범위(52.4 %), 여자는 IV시간범위(24.0 %)에서 강한 주시가 이루어진 특성이 있어, 성별 차이가 나타난 것을 확인할 수 있었다. 즉, 성별에 따라 선택적 주의집중이 일어나는 시간범위가 서로 다르다는 것에서부터 성별 차이를 향후 피험자 특성으로 설정하여 실험하고 분석하는 것이 필요하다.

관계형 데이터 웨어하우스의 복잡한 질의의 처리 효율 향상을 위한 비트맵 조인 인덱스 선택에 관한 연구 (A Study on Selecting Bitmap Join Index to Speed up Complex Queries in Relational Data Warehouses)

  • 안형근;고재진
    • 정보처리학회논문지D
    • /
    • 제19D권1호
    • /
    • pp.1-14
    • /
    • 2012
  • 데이터 웨어하우스는 크기가 방대하기 때문에 인덱스의 선택은 질의어 처리의 효율성에 상대한 영향을 준다. 인덱스는 질의 처리 비용을 줄이지만, 그것이 차지하는 기억 영역과 데이터베이스의 변경에 따른 보수라는 비용이 수반된다. 데이터 웨어하우스에서 하나의 사실 테이블과 여러 개의 차원 테이블 사이의 조인을 행하는 스타 조인 질의어와 차원 테이블의 선택을 최적화하기 위해서 비트맵 조인 인덱스가 잘 적용된다. 비트맵 조인 인덱스는 이진수로 표현되기 때문에 저장 비용은 적게 들지만 인덱스 할 후보 속성들이 많이 생성되기 때문에 그 중에서 인덱스 할 속성들을 선택하는 일은 어려운 과제가 된다. 인덱스 선택은 일단 후보 속성들의 개수를 축소하고, 그 중에서 인덱스를 선택하게 된다. 본 논문에서는 데이터 마이닝 방법을 사용해서 비트 맵 조인 인덱스 선택 문제에서 후보 속성들의 개수를 축소하는 것을 해결한다. 질의어에 있는 속성들의 빈도에 기준해서 후보 속성들의 개수를 감소시키는 기존의 방법에 비해서 본 논문은 속성들의 빈도를 사용함과 동시에 차원 테이블의 크기, 차원 테이블의 튜플 크기, 디스크의 페이지 크기 등을 고려한다. 그리고 데이터마이닝 기법으로 빈발 항목집합을 마이닝하여 후보 속성들의 개수를 효과적으로 줄인다. 후보 속성집합들의 비트 맵 조인 인덱스에 비용함수를 적용해서 최소의 비용과 기억 영역 제한에 적합한 속성집합들의 비트 맵 조인 인덱스를 구한다. 본 논문의 방법의 효율성을 평가하기 위해서 기존의 방법들과 비교 분석을 한다.

감염병 확산에 따른 레스토랑 선택속성 변화 분석: 텍스트마이닝 기법 적용 (Analysis of Changes in Restaurant Attributes According to the Spread of Infectious Diseases: Application of Text Mining Techniques)

  • 유준일;이은지;구철모
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.89-112
    • /
    • 2023
  • 2020년 3월, 코로나바이러스 팬데믹으로 선포되면서, 다양한 방역 조치가 취해져 왔다. 이에 따라, 관광 및 환대 산업 내의 많은 변화들이 야기되었다. 특히 레스토랑 산업에서는 비대면 서비스 및 좌석 간 거리두기 등 방역 지침이 시행되었다. 전통적으로 레스토랑 선택속성에 대한 연구는 분위기, 서비스 품질, 음식의 품질을 포함한 3가지 속성의 중요성이 강조해 온 데 반해, 코로나19 이후 레스토랑 이용자를 대상으로 레스토랑 선택속성을 탐색한 연구는 미비한 실정이다. 이에 따라, 본 연구에서는 코로나19라는 환대 산업 내의 환경적 변화에 대한 이해에 기반하여, 국내 온라인 리뷰 데이터 상에서 새로운 레스토랑 경험적 속성을 확인하기 위한 탐색적인 접근을 시도하였다. 본 연구는 서울 을지로 지역에 위치한 일반음식점 및 휴게음식점 475개로 네이버 플레이스에 등록된 총 31,115개의 온라인 리뷰를 분석 단위로 고려하였다. 분석 방법은 단어 빈도와 역문서 빈도의 곱으로 산출된 TF-IDF와 잠재적 토픽들을 추출하는 확률적 모델 알고리즘인 LDA 토픽모델링 기법을 통해 온라인 리뷰 내에서 단어들의 군집화를 통해 레스토랑 선택속성을 재분류하고자 하였다. 분석 결과, 분위기, 서비스 품질, 음식 품질과 함께 코로나19 이후 레스토랑의 새로운 속성으로 "감염병 예방"요인이 도출되었다. 본 연구는 기존 레스토랑 선택속성에서 제시하는 세 가지 속성들을 범주화하고, 나아가 새로운 속성을 제시하였다는 점에서 기존 레스토랑 선택속성 문헌을 확장하여 학술적 의의가 있다. 나아가, 분석 결과에 기반하여 레스토랑 운영의 측면 및 정책적 관점에서의 실무적 제언을 시도하였다.