• 제목/요약/키워드: 발생 가능한 규칙의 수

검색결과 174건 처리시간 0.025초

연관성 규칙의 탐색을 위한 순수 대칭적 J 측도의 활용 (Utilizing Purely Symmetric J Measure for Association Rules)

  • 박희창
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2865-2872
    • /
    • 2018
  • 데이터 마이닝 분야에서 개발된 기법에는 연관성 규칙, 군집분석, 의사결정나무, 신경망 등 여러 가지가 있는데 이들 중에서 연관성 규칙은 지지도, 신뢰도, 그리고 향상도 등 여러 가지 연관성 평가 기준을 이용하여 항목들 간에 특정한 연관성을 탐색하는 기법이다(Park, 2014). 이러한 연관성 규칙은 Agrawal et al.(1993)이 처음 제안하였으며, 그 이후로 여러 연구자들에 의해 연구가 진행되고 있으며, 최근에는 교차 엔트로피와 관련된 연구들이 발표되고 있다(Park, 2016b). 본 논문에서는 기존에 발표된 J 측도에 방향성과 순수성을 고려한 순수 대칭적 J 측도를 제안하고 예제를 활용하여 그 유용성에 대해 알아보았다. 그 결과, 동시발생빈도가 증가함에 따라 순수 대칭적 J 측도가 기존의 J 측도와 대칭적 J 측도, 순수 교차 엔트로피 측도보다 훨씬 분명하게 변하는 것을 알 수 있었으며, 불일치빈도의 크기에 따라서도 순수 대칭적 J 측도가 변화하는 폭이 더 커짐에 따라 연관성 유무를 더 분명하게 파악할 수 있었다. 따라서 순수 대칭적 J 측도는 데이터가 존재하는 어느 분야에서든지 연관성 규칙의 평가에 적용이 가능할 것으로 생각된다.

DDAG: 효율적인 한국어 형태소 해석 방법 (DDAG: An Efficient Method for Morphological Analysis of Korean)

  • 김덕붕;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.341-353
    • /
    • 1993
  • 기존의 한국어 형태소 해석 시스템들은 철자 변화형 어절에 대한 처리가 매우 효율적이지 못했다. 대개가 문제를 일으키는 형태소들의 변형들을 모두 사전에 등록하여 후처리 형태로 다루려 하거나, 각 형태/음운 규칙을 적용한 다음 거기에 대응하는 후보 단어들을 사전 검색을 통해 확인하는 방법들을 취하고 있다. 그러나 이러한 방법들은 과다한 사전 정보의 중복이나 계산의 중복으로 인하여 비효율적인 면을 많이 내포한다. 또한, 기존의 한국어 형태소 시스템들은 거의 모두가 형태소해석 엔진과 언어학적인 지식(특히, 철자 규칙과 형태소 배열 규칙)이 제대로 분리되지 않아 시스템 확장이 매우 어려웠다. 이 논문에서는, 철자 변화형 어절을 후처리에 의하지 않고, 사전 검색과 함께 하나의 오토마타에 의해 처리하면서, 형태소 해석시 발생하는 중복 계산을 최대한 배경하고, 또한 형태소 해석 엔진과 언어학적인 지식을 완전히 분리하여 시스템의 확장성을 한층 높인, 효율적인 한국어 형태소 해석 시스템 DDAG를 소개한다. 이 시스템의 주요 알고리즘의 계산적인 복잡도는 n이 입력 어절의 길이이고, m이 입력 어절을 이루고 있는 형태소의 최대 수라고 할 때 다음과 같이 분석된다: (1) 철자 변화의 처리와 사전 검색 부분의 계산적인 복잡도는 $O(n^2)$이고, (2) 형태소 배열 검사와 모든 가능한 결과를 출력해 내는 부분은 $O(2^m)$이다. 여기에서 m의 실질적인 값은 복잡한 한국어 용언의 경우 최대 8이다.

  • PDF

굽타의 진리 수정론

  • 송하석
    • 논리연구
    • /
    • 제1권
    • /
    • pp.65-93
    • /
    • 1997
  • 거짓말쟁이 역설에 대한 전통적인 설명은 다음 두 가지로 주어진다. 역설을 일으키는 거짓말쟁이 문장이 자기지시적이기 때문에 역설이 발생하므로 자기지시적 문장을 금함으로써 그 역설을 피할 수 있다는 것이 첫 번째이고, 둘째는 모든 문장을 참이나 거짓이라고 주장하는 진리값에 대한 배중률(principle of bivalence)에 집착하기 때문에 그 역설이 발생한다고 생각하고 제3의 진리값을 갖는 문장이 있음을 인정해야 한다는 것이다. 이러한 전통적인 설명과 달리 진리 개념을 비일관적인 개념으로 보고 진리 술어와 그 외의 술어의 용법상의 차이를 설명함으로써 거짓말쟁이 역설에 대한 새로운 설명을 시도하고자 하는 것이 굽타의 "진리 수정론"이다. 굽타의 진리 수정론에 따르면, 진리 술어 외의 술어들은 그 외연이 고정적으로 산출되고 그 과정은 적용 규칙(rule of application)에 의해서 설명되지만 진리 술어는 순환적 정의처럼 고정된 외연을 만들어내지 못하고 단지 가설적 외연만 만들어 낼 뿐이다. 이렇게 진리술어의 가정적 외연을 산출해내는 과정은 수정규칙(rule of revision)에 의해서 설명된다. 요컨대 진리 수정론은 순환적 개념도 의미를 가질 수 있음을 보여주는 의미론적 구조틀이 있다는 것과 진리개념이 바로 그러한 의미구조틀에 의해서 의미를 갖는 순환적 개념이라는 것이다. 그리고 굽타는 그러한 의미구조 틀을 일정한 규칙을 갖는 함수로 설명하려고 시도한다. 즉 진리개념을 일관적인 것으로 보고 거짓말쟁이 역설을 해결해야 할 병리적 현상으로 보는 진리의 일관성론과 달리 굽타의 진리 수정론은 진리술어 자체가 비일관적이기 때문에 거짓말쟁이 역설은 그 술어의 속성상 자연스러운 것이지 피해야 만할 병리적 현상이 아니라고 주장한다. 필자는 의미론적 역설에 대한 여러 가지 설명 중에서 진리 수정론이 가장 설득력 있는 것으로 인정하고 그에 대한 가능한 반론을 검토하고 그에 대한 답변을 시도했다. 또한 진리 수정론을 통해서 거짓말쟁이 역설을 설명하고 -해결하려는 것이 아니라- 나아가서 진리 개념에 대한 이해를 제공해보려고 시도했다.

  • PDF

부분 분석 결과를 공유하는 한국어 형태소 분석 (Korean Morphological Analysis Sharing Partial Analyses)

  • 이상호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.75-79
    • /
    • 1994
  • 한국어 어절의 모든 가능한 형태소 분석 결과는 형태소 격자 구조로 대응된다. 즉, 형태소 분석과정은 형태소 격자 구조를 만드는 과정과 동일하다고 말할 수 있다. 기존의 방법들은 여러개의 가능한 분석 결과에 중복되는 형태소들을 그대로 저장하여 자료 관리의 비효율성이 있었다. 본 논문에서 설명하는 형태소 분석기는 형태소 분석의 중간 결과를 공유하여, 자료의 중복 저장을 피했고, 모든 가능한 형태소 분석 결과를 형태소 격자 구조의 가능한 모든 경로로 대응하였다. 한편, 형태소 배열 규칙은 품사 태깅된 말뭉치로부터 자동으로 추출되었다. 또한, 사전도 품사 태깅된 말뭉치로부터 자동으로 구축되었으며, 굴절된 형태소는 등록되지 않는다. 그러나 불규칙 및 축약 현상에 관한 정보는 수동으로 추가되었다. 불규칙 및 축약 현상의 발생 가능 위치는 한글 자소 패턴에 의해서 찾아지고, 이들 현상의 처리는 절차적인 방법에 의해 해결되었다.

  • PDF

Mid-loop 운전중 RHR 기능 상실사고시 최대압력 및 보조급수 공급 여유시간 분석

  • 김원석;정영종;장원표
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1996년도 춘계학술발표회논문집(2)
    • /
    • pp.473-480
    • /
    • 1996
  • 영광 3/4호기 mid-loop 운전중 잔열제거(RHR) 기능 상실사고시 열수력적 현상을 최적 전산코드인 CATHARE2를 이용하여 해석하였다. 이러한 사고시 열수력적 현상은 일,이차측 냉각재 방출유로와 계통내 비응축성 가스의 거동에 의해 크게 영향을 받는다. 본 연구에서는 2개의 경우를 모의하였는데, 하나는 계통내 방출유로가 있는 경우이며 다른 하나는 방출유로가 없는 경우를 계산하였다. 이 때 사용된 가정은 다음과 같다. (가) 계통은 부분충수 운전 상태로 상부에 비응축성 가스나 증기로 가득 차 있다. (나) 증기발생기는 1대만이 이용 가능하고 이차측은 습식보관 상태이며, 보조급수는 공급되지 않고 이차측 압력은 대기압 상태이다 (다) 사고는 원자로 정지후 2일후 발생한다. 이와같은 조건하에서 사고시 계통 최대압력은 방출유로가 있는 경우 사고후 6,000 초에 0.27 MPa이며, 방출유로를 통한 유량은 총 2.4 kg/s이다. 이 방출유량을 외삽하여 계통수위가 고온관 바닦까지 도달하는데 걸린 시간은 사고후 약 5.67시간이다. 증기발생기 U-튜브를 통한 열전달에 의해 이차측 증기 발생으로 이차측 수위가 하락하면 증기발생기 reflux cooling은 제한을 받을 수 있다. 이 경우 이차측 수위가 U-튜브의 active 영역 상부까지 도달하는데 걸리는 시간은 사고후 약 10시간으로 계산되었다. 그러므로 이 경우 보조급수 공급 여유시간보다 노심 노출시간이 더 빨리 도달하여 노심을 손상시킨다. 사고시 수위지시계는 계통감압에 큰 영향을 주지 못하기 때문에 가능한 빨리 닫아 계통 inventory를 유지하는 것이 이차측 보조급수공급보다 우선한다.합한 설계방안으로 분석되었다.크다는 단점이 있다.TEX>$_2$O$_3$ 흡착제 제조시 TiO$_2$ 함량에 따른 Co$^{2+}$ 흡착량과 25$0^{\circ}C$의 고온에서 ZrO$_2$$Al_2$O$_3$의 표면에 생성된 코발트 화합물을 XPS와 EPMA로 부터 확인하였다.인을 명시적으로 설명할 수 있다. 둘째, 오류의 시발점을 정확히 포착하여 동기가 분명한 수정대책을 강구할 수 있다. 셋째, 음운 과 정의 분석 모델은 새로운 언어 학습시에 관련된 언어 상호간의 구조적 마찰을 설명해 줄 수 있다. 넷째, 불규칙적이며 종잡기 힘들고 단편적인 것으로만 보이던 중간언어도 일정한 체계 속에서 변화한다는 사실을 알 수 있다. 다섯째, 종전의 오류 분석에서는 지나치게 모국어의 영향만 강조하고 다른 요인들에 대해서는 다분히 추상적인 언급으로 끝났지만 이 분석을 통 해서 배경어, 목표어, 특히 중간규칙의 역할이 괄목할 만한 것임을 가시적으로 관찰할 수 있 다. 이와 같은 오류분석 방법은 학습자의 모국어 및 관련 외국어의 음운규칙만 알면 어느 학습대상 외국어에라도 적용할 수 있는 보편성을 지니는 것으로 사료된다.없다. 그렇다면 겹의문사를 [-wh]의리를 지 닌 의문사의 병렬로 분석할 수 없다. 예를 들어 누구누구를 [주구-이-ν가] [누구누구-이- ν가]로부터 생성되었다고 볼 수 없다. 그러므로 [-wh] 겹의문사는 복수 의미를 지닐 수 없 다. 그러면 단수 의미는 어떻게 생성되는가\

  • PDF

잠수함의 침수시 대응을 위한 지식기반시스템에 관한 연구 (A Study on Knowledge Based System for Submarines Leakages)

  • 이동곤;이재용;이재환;이경호
    • 대한조선학회논문집
    • /
    • 제38권3호
    • /
    • pp.107-116
    • /
    • 2001
  • 잠수함은 수중 활동으로 인하여 압력선체에 항상 수압을 받고 있기 때문에, 손상시에는 수상함에 비하여 그 영향이 상대적으로 크며 대처 가능한 수단과 시간은 제한되어 있다. 수압으로 인하여 작은 파손에도 잠수함이 치명적인 손상을 받을 수 있으며, 이는 곧 함의 임무 수행능력의 손실뿐만 아니라 승조원의 안전에도 직결되는 상황을 초래할 수 있다. 본 연구에서는 잠수함의 손상시, 크게 압력선체 손상과 배관 계통이 손상된 경우만을 고려하여 두 경우 누수가 발생하였을 경우에 효과적으로 대응할 수 있는 지식기반시스템을 개발하였다. 잠수함의 설계 지침서와 설계 경험을 바탕으로 잠수함의 운용자로부터 위기 대응과 관련된 지식을 추출하여 분석, 정리하였고 도출된 지식들은 지식기반시스템 개발도구를 사용하여 규칙의 형태로 지식베이스에 저장하였으며, 후향 추론기법을 사용하여 상황대처에 대한 결과를 도출하였다.

  • PDF

파력발전형 유공 부유식방파제의 발전효율 검토 (Hydraulic experiment on floating breakwater mounted wave-power generation)

  • 윤재선;하태민;예동완;이병욱;송현구
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.214-214
    • /
    • 2021
  • 본 연구에서는 부유식방파제의 입사면과 전달면이 Slit으로 구성되어있어 유수실이 존재하는 투수성 부유식방파제에 대하여 2차원 자유도운동에 따른 발전가능성을 검토하였다. 입사파랑이 부유식방파제 유수실구간의 내부로 유입될 때 발생하는 강한 와류는 입사파랑의 주기와 파고가 증가할수록 궤적이 높고 길게 발생하게 된다. 이러한 원리를 이용하여 부유식방파제 유수실구간 입사면과 전달면에 각각 양방향으로 회전이 가능한 수차를 설치하고 와류 발생에 따른 2차 에너지 생성 가능성을 검토하였다. 실험결과, 입사파랑의 내습에 따라 수차는 시계방향과 반시계방향으로 회전하는 것을 확인할 수 있었으며, 상대적으로 주기가 긴 규칙파랑 실험조건(파고 0.1m, 주기 2.0sec)에서 약 0.5W 내외의 지속적인 전기에너지를 확보하는 것으로 검토되었다.

  • PDF

데이터베이스 테이터의 고장진단 및 복구를 위한 전문가 시스팀

  • 이길행;우왕돈;조주현
    • ETRI Journal
    • /
    • 제14권4호
    • /
    • pp.148-164
    • /
    • 1992
  • 본 논문에서는 TDX-10 데이터베이스 데이터의 고장을 주기적으로 진단하고 복구할 수 있는 고장진단 전문가 시스팀을 제안하고 구현하였다. 실시간 환경 및 분산구조를 갖는 데이터베이스 관리 시스팀에서 데이터베이스의 효과적인 접근을 위해서 필요한 데이터베이스의 데이터 즉, 디렉토리와 딕셔너리는 매우 중요하며 고장이 발생할 경우 데이터베이스 관리시스팀에 미치는 영향은 치명적이다. 따라서, 실시간 환경을 갖는 데이터베이스 관리 시스팀에서 데이터베이스 데이터에 대한 고장 진단 및 복구는 필수적이라고 할 수 있다. 본 논문에서 제안한 고장진단 전문가 시스팀은 데이터베이스 데이터를 운용중 변하는 부분과 변하지 않는 부분으로 분류하고 미리 주어진 고장진단 규칙에 따라 진단하는 방법이다. 데이터베이스 데이터의 고장진단 데이터, 고장진단 규칙, 고장진단 데이터 생성기, 고장진단 데이터 검증기, 그리고 고장진단기로 구성되어 있다. 고장진단 데이터는 고장진단기가 데이터베이스 데이터를 주기적으로 진단하기 위하여 사용하는 마스터 데이터로서 두개가 존재한다. 고장진단 데이터 생성기는 데이터베이스 데이터의 고장진단을 위한 데이터 구조를 생성하고 데이터베이스로부터 데이터베이스를 데이터를 중복하여 읽어들이는 역할을 한다. 이와 같은 과정은 시스팀이 초기에 동작을 시작하거나 운용중 운용자에 의해서 릴레이션의 추가 및 삭제, 그리고 튜플의 추가등과 같은 사건이 발생할 경우에 이루어진다. 데이터베이스 검증기는 고장진단 데이터 생성기가 중복하여 생성한 데이터에 대해서 데이터베이스 데이터의 제작시의 초기 오류를 검증해냄으로써 데이터베이스 관리 시스팀의 안전한 운용을 가능하게 하며 고장진단기가 데이터베이스 데이터를 주기적으로 진단할 데이터를 탄생시킨다. 마지막으로 고장진단기는 주기적으로 데이터베이스 데이터의 고장을 진단하여 고장이 발생한 데이터를 미리 분류한 규칙에 따라 원래의 데이터로 복구하거나 운용자에게 보고함으로써 고장에 대비하도록 한다. 그리고 데이터베이스 상의 운용자에 의한 변경을 감지하여 고장진단 데이터의 재생성을 지시한다. 본 논문에서 제시하고 구현한 데이터베이스 데이터의 고장진단 및 복구를 위한 전문가 시스팀은 실시간 환경과 고장허용 환경, 분산 구조 그리고 빈번한 접근을 갖는 데이터베이스 관리 시스팀에서 아주 중요한 역할을 할 수 있다.

  • PDF

UTF-8 부호의 HDB-3스크램블링 최소화를 위한 문자의 원천부호화 규칙 (Source Coding Rule of Characters to Minimize HDB-3 Scrambling in Line Coder for UTF-8 code)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권9호
    • /
    • pp.1019-1026
    • /
    • 2015
  • 본 논문은 UTF-8 부호화된 문자의 원천부호가 회선부호기에 입력될 때 HDB-3 스크램블링을 최소화하도록 하는 문자의 원천부호화 규칙을 연구하였다. 기존 연구는 원천부호자체가 회선부호기에 입력될 때 HDB-3 스크램블링을 최소화하기 위한 문자의 원천부호화 규칙에 관한 내용이었으나 이번 연구에서는 원천부호가 UTF-8부호로 변환되면서 UTF-8부호와 원천부호간의 스크램블링 관계가 상호 대응적이지 않음을 분석하였다. 따라서 UTF-8 부호의 HDB-3 스크램블링 최소화를 위한 문자의 원천부호화 규칙이 없을 경우, UTF-8부호에서 스크램블링이 발생하는 부호를 분석하기 위해 원천부호를 모두 UTF-8부호로 변환한 후에 분석을 통해 스크램블링이 발생하지 않는 원천부호영역에서 부호화해야 한다. 제안된 UTF-8 부호에 대한 문자의 원천부호화 규칙을 적용할 경우, 이러한 복잡한 과정을 거치지 않고 스크램블링을 최소화 할 수 있는 문자의 원천부호화가 가능하다.

데이타 웨어하우스 환경에서의 설명기반 데이타 마이닝 (Explanation-based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이타들이 축적되고 있다. 이러한 데이타로부터 유용한 지식을 추출하기 위해 여러 가지 데이타 마이닝 기법들이 연구되어왔다. 특히 데이타 웨어하우스의 등장은 이러한 데이타 마이닝에 있어 필요한 데이타 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이타 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성이 없는(trivial, spurious and irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이타 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이타 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적은 이러한 데이타 마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이타 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이타 웨어하우스로부터 연관규칙을 검증하는 일련의 아키텍쳐(architecture)를 제시하고자 한다. 먼저 데이타 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이타 웨어하우스와 데이타 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이타 웨어하우스의 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현 방법으로 Relational predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사론 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.

  • PDF