• 제목/요약/키워드: 데이터 밀도

검색결과 917건 처리시간 0.025초

몬테카를로 방법 기반의 이동최소제곱을 이용한 밀도 데이터의 벡터장 시각화 (Visualization of Vector Fields from Density Data Using Moving Least Squares Based on Monte Carlo Method)

  • 김종현
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제30권2호
    • /
    • pp.1-9
    • /
    • 2024
  • 본 논문에서는 밀도 데이터로부터 다양한 벡터장 패턴을 시각화하는 새로운 방법을 제안한다. 이를 위해 물리 기반 시뮬레이션과 기하학적 처리에서 사용되는 이동최소제곱(Moving least squares, MLS)을 이용한다. 하지만 일반적인 MLS는 벡터기반의 제약조건을 통해 고차 보간되기 때문에 밀도의 특성을 고려하지 못한다. 본 논문에서는 입력 데이터에 내포되어 있는 밀도의 특성을 효율적으로 고려하기 위해 몬테카를로 기반의 가중치를 MLS에 통합하여 다양한 형태의 백터장을 표현할 수 있도록 알고리즘을 설계한다. 결과적으로 일반적인 MLS와 발산제약 기반의 MLS 같은 기존 기법으로는 표현하기 힘든 디테일한 벡터장을 실험을 통해 보여준다.

관찰 확률 최대화에 의한 화자 적응 알고리즘 (Speaker Adaptation Algorithm Based on a Maximization of the Observation Probability)

  • 양태영;신원호;전원석;김지성;김지성;김원구;이충용;윤대희;차일환
    • 한국음향학회지
    • /
    • 제17권6호
    • /
    • pp.37-42
    • /
    • 1998
  • 본 논문에서는 SCHMM에 적용된 관찰 확률 최대화에 의한 화자 적응 알고리즘을 제안한다. 제안된 알고리즘은 SCHMM의 관찰 확률 밀도들이 새로운 화자의 음성 특징을 잘 표현하지 못하는 경우 인식 성능이 저하되는 것을 막기 위하여, 적응 데이터의 각 특징 벡터들이 최대의 관찰 확률을 가질 수 있도록 관찰 확률 밀도를 결정하는 평균 벡터 μ와 분산 행렬 Σ를 기울기 탐색(gradient search) 알고리즘에 의해 반복적으로 적응시켜 주는 방법이다. SCHMM의 상태 천이 확률 A와 혼합 밀도 계수 C는 관찰 확률 밀도 적응 과정 을 거친 후, 적응 데이터로부터 구한 확률과 기존 확률의 가중 평균을 취하는 과정을 반복 하여 적응시켜 주었다. 제안된 화자 적응 알고리즘을 사용하여 단독음 인식 실험을 수행한 결과, 화자 적응을 수행하지 않았을 때와 비교하여 화자 독립 시스템에서는 평균 9.8%, 남 성 화자 종속 시스템에서는 평균 46.0%, 여성 화자 종속 시스템에서는 평균 52.7%의 인식 률 향상을 보였다.

  • PDF

음성 및 데이터를 포함하는 이동통신 혼합 트래픽의 Erlang 용량 산출방법 (Erlang Capacity Calculation for the Mixed Traffic of 3G1x CDMA Wireless Networks Integration for Voice over Internet Protocol)

  • 정현규
    • 전자통신동향분석
    • /
    • 제17권5호통권77호
    • /
    • pp.37-46
    • /
    • 2002
  • 이동통신에서는 무선자원의 효율적인 사용을 위하여 variable rate vocoder 및 VoX 기법을 이용한 음성 전송이 일반적 추세이며, 버스티 특성을 갖는 패킷 트래픽의 경우 statistical multiplexing을 이용하여 무선 채널의 사용을 극대화 시킨다. 트래픽 밀도를 나타내는 Erlang 용량은 일정속도의 회선교환 트래픽에 대하여 동시에 점유할 수 있는 dedicated circuit의 수에 기초하는 개념이므로 statistical multiplexing으로 처리되는 데이터 패킷의 트래픽 밀도는 queuing model에 근거한 데이터 스루풋이 현실적이다. 그러나 이동통신 시스템에서 트래픽 특성을 달리하는 circuit 및 패킷 타입의 혼합 서비스가 동시에 제공될 경우 네트워크 planning을 위한 구성 시스템의 용량산정을 위해 트래픽 밀도의 통합적인 표현을 요구한다. 따라서 Erlang 용량과 데이터 스루풋의 상호 변환을 통하여 네트워크 구성요소의 용량 산정에 적당한 용량표현을 선택할 수 있다. 본 고에서는 트래픽 처리기로서의 통신시스템을 기술하기 위하여 일반적인 텔레트래픽 시스템 모델과 파라미터를 정의한다. 또한 음성 및 비음성 서비스의 혼합 트래픽 환경에서 트래픽 밀도계산을 위한 Erlang 용량과 데이터 스루풋의 상호 변환 관계를 소개한다. 마지막으로 3G1x 무선접속환경에서 음성 및 HSPD 서비스가 공존할 경우 기지국 CE dimensioning에 필요한 혼합 트래픽 Erlang 용량 산출 방법을 기술한다.

다계층 밀도기반 군집화 기법 (Multi-hierarchical Density-based Clustering Method)

  • 신동문;정석호;이경민;이동규;손교용;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.797-798
    • /
    • 2009
  • 군집화는 대용량의 데이터로부터 유용한 정보를 추출하는 데에 적합한 데이터마이닝 기법들 중 하나이다. 군집화 기법은 주어진 데이터그룹 내에서 사전정보 없이 의미있는 지식을 발견할 수 있으므로 큰 어려움이 없이 실제 응용분야에 적용할 수 있다. 또한, 대용량 데이터를 다룰 때에 개별적인 데이터에 대한 접근 횟수를 줄이고, 알고리즘이 다루어야 할 데이터 구조의 크기를 줄일 수 있다. 본 논문에서는 밀도-기반 군집화 기법을 기반으로 하는 새로운 군집화 기법을 제안한다. 우리가 제안하는 군집화 기법은 반복적인 군집화 과정을 통하여 군집 내 주변 잡음을 제거하고 더 세밀하게 집단을 세분화하는 것이 가능하다. 또한, 군집을 표현하는 데에 계층구조로 나타내어 각 군집의 상관관계를 파악하는 데에 유리하다. 본 논문에서 제안하는 군집화 기법을 통하여 다양한 밀도를 가진 군집들을 효과적으로 분류할 수 있을 거라고 기대된다.

최소 자승법을 이용한 태양광.풍력 복합 발전 시스템의 최적 용량 선정 (An Optimum Power Rating Selection of a Photovoltaic-Wind Hybrid Generation System Utilizing Least Square Method)

  • 김시경;유권종;송진수
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1996년도 하계학술대회 논문집 A
    • /
    • pp.379-381
    • /
    • 1996
  • 본 논문에서는 그리드 독립형 태양광 풍력 복합 발전 시스템에 대한 최적의 태양광 어레이 사이즈 및 풍력 발전 시스템을 결정하는 방법을 제안하였다. 연구에 사용되어진 풍력 및 태양광 일사량에 대한 데이터는 제주도 지역에서 1년간 실측되어진 데이터를 기준으로 하였으며, 이러한 실측되어진 데이터는 풍속 및 태양광의 확률 밀도 함수(Probability Density Function)를 결정하는데 사용되어 졌다. 풍속 및 태양광 일사량의 확률 밀도 함수와 태양광 어레이 및 풍력 발전기의 여러 파라미터는 복합 발전 시스템의 평균 발생 전력을 계산하는데 사용하였고, 도서지역에서 1년간 계측되어진 부하의 변동에 대하여 최적의 태양광 어레이, 풍력 발전 용량을 선정 하기 위하여 최적 자승의 법칙이 사용되었다.

  • PDF

해상교통 밀집도 평가방법의 비교분석을 통한 개선방안 제안

  • 김윤지;이정석;조익순
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2022년도 춘계학술대회
    • /
    • pp.426-428
    • /
    • 2022
  • 해상 교통량을 정량적으로 평가하고 추출하기 위한 방법으로 선박 AIS 데이터 기반의 밀집도 분석을 활용하고 있다. 밀집도는 단위시간 당 단위면적에 분포하는 선박 통항량을 계산한 것으로, 일반적으로 그리드 셀 내에 존재하는 선박 항적 포인트 개수, 항적도 라인 길이, 선박 척수 등을 계산한 밀집도 분석 방법과 커널 밀도 추정(Kernel Density Estimation) 방법 등이 있다. 하지만, AIS 데이터의 특징상 선박 속력에 따라 수신 주기가 다르기 때문에 항적이 등간격으로 나타나지 않는 문제점이 있으며, 선박의 이동과 시간의 속성으로 인해 각각의 밀집도 분석 방법은 한계점이 존재한다. 따라서 본 연구에서는 실측 AIS 데이터를 이용하여 다양한 방법의 선박 밀집도 분석을 수행하고 이를 비교하였다. 그 결과, 항적도 라인 길이에 의한 밀집도 분석이 가장 정량적인 방법으로 나타났으며 이를 통항 척수로 변환할 수 있는 선박 밀집도 분석을 개선방안으로 제안한다.

  • PDF

밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구 (A Case Study on Text Analysis Using Meal Kit Product Review Data)

  • 최혜선;연규필
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.1-15
    • /
    • 2022
  • 본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고 있는 밀키트 제품에 대한 리뷰 334,498건을 스크래핑하여 수집하였다. 텍스트 자료에 대한 전처리 과정을 거쳐 제품 리뷰에 빈번히 등장하는 단어를 추출한 후 워드클라우드 및 감성분석을 수행하였다. 감성분석시 제품 리뷰에 대한 긍정 또는 부정의 레이블은 평점을 기준으로 설정하여 반응변수로 활용하였고, 입력변수로는 단어들의 정규화 단어빈도-역문서빈도 (TF-IDF) 값을 구하여 사용하였다. 리뷰의 극성을 판별하는 모형으로는 로지스틱 회귀모형, 서포트 벡터 머신, 랜덤 포레스트 알고리즘을 적용하였으며, 분류 정확도 및 해석가능성을 고려하여 로지스틱 회귀모형을 최종 모형으로 선택한 후 제품 범주별 감성분석 모형으로 사용하였다. 각 제품 범주별로 도출된 로지스틱 회귀모형으로부터 밀키트 제품 구매 후 긍·부정의 감성을 발생시킨 주요 요인들을 밝혀내었다. 결과적으로 텍스트 분석을 통해 밀키트 제품 개발 시 특정 카테고리, 메뉴, 재료에 대한 긍정 요소를 극대화하고 부정적 위험 요소를 제거할 수 있는 기반을 제공할 수 있음을 확인하였다.

센서의 불균일한 배포밀도를 고려한 효율적인 데이터 중심 저장기법 (An Efficient Data Centric Storage Scheme with Non-uniformed Density of Wireless Sensor Networks)

  • 성동욱;이석재;송석일;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.135-139
    • /
    • 2007
  • 최근 자연 환경 조사, 군사 응용 시스템, 환경 변화 감시 등의 여러 응용 분야에서 무선 센서 네트워크 자체를 데이터 저장 장치로 활용하는 데이터 중심 저장기법(DCS)에 대한 연구들이 진행되고 있다. 기존에 제안된 데이터 중심 저장기법들은 데이터들의 지역성이 고려되지 않아 범위질의 처리에 비효율적인 문제점(Q-NiGHT)과 센서 배포밀도가 불균일한 경우 각 센서의 데이터에 대한 저장 부하가 불균등해지는 문제점(KDDCS)을 갖는다. 본 논문에서는 이러한 기존의 문제점을 해결하고자, 데이터 저장 위치의 지역성(Locality)를 만족시키며 센서 배포 밀도를 고려한 새로운 데이터 중심 저장 기법을 제안한다. 제안하는 기법은 전체 센서 영역을 그리드로 나누고, 각 셀의 센서 밀도정보를 비트로 표현하는 배포 밀도 비트맵을 만들어 배포한다. 센서들은 데이터를 저장 하거나 탐색할 때 배포 밀도 비트맵을 이용하여 데이터 저장위치를 계산함으로써 별도의 통신 없이 최적의 저장위치를 선정할 수 있다. 본 논문에서는 시뮬레이션을 통해 기존 연구와의 성능 평가 하여 센서들의 배포밀도가 균일한 환경뿐만 아니라 불균일한 환경에서도 각 센서들의 데이터 저장부하를 고르게 분산시키고, 범위질의 처리 또한 효율적으로 처리됨을 보였다.

  • PDF

센서 네트워크에서 데이터 왜곡을 최소화하는 최적 노드 개수 (On the Optimal Number of Nodes Minimizing Data Distortion in Sensor Networks)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (A)
    • /
    • pp.119-120
    • /
    • 2007
  • 센서 네트워크는 온도, 습도, 무게, 화학물질 밀도 등과 같이 공간적 시간적 상관관계가 있는 데이터를 실시간으로 수집하는 응용에 적용될 수 있다. 본 논문에서는 1차원과 2차원의 센서 네트워크에서 센서 노드의 작동 확률을 고려한 경우에 데이터 왜곡을 모델링하는 수식을 제시하고 데이터 왜곡을 최소화할 수 있는 최적의 노드 개수에 대한 새로운 계산 결과를 제시한다 계산 결과는 최적의 노드 개수는 패킷의 hop 지연과 관련이 있다는 것을 보여주었다.

  • PDF

연속류 uTSN 수집 데이터 가공 방안 (Processing the Data from the uTSN of Uninterrupted Traffic Flow)

  • 박은미;서의현
    • 지능정보연구
    • /
    • 제16권1호
    • /
    • pp.57-69
    • /
    • 2010
  • uTSN(ubiquitous Transportation Sensor Network)의데이터수집환경은기존ITS(Intelligent Transportation System) 환경과 커다란 차이가 있다. 지점 혹은 구간 검지체계를 근간으로 불연속적인 데이터를 수집하는 ITS 환경과 달리, 유비쿼터스 교통환경에서는 연속적인 개별차량 데이터의 취득이 가능하다. 또한 대응전략 구사에 있어서도, 구간단위 제어나 정보제공만 가능했던 ITS와 달리, 유비쿼터스 환경에서는 개별차량단위의 미세제어가 가능하다. 이러한 환경변화에 맞추어 수집데이터의 가공방식도 새로이 개발되어야 한다. 연속류 uTSN 환경에서 수집된 개별차량 위치와 개별차량 속도 데이터를 대상으로, 가공의 1차적 목적인 교통상황 판단을 위한 가공 방안을 제시하였다. uTSN으로부터 수집된 개별차량 단위 데이터를 기존 ITS와 같은 방식으로 집락하여 가공한다고 하면 그 미세한 정보는 다 손실되고 평균적 추세만 남게 된다. 본 연구에서는 수집 데이터에 담겨있는 미세한 정보를 손실하지 않음과 동시에 교통상황판단에 효과적인 정보를 생성하는 가공방식으로서, 3차원 속도, 교통량, 밀도 프로파일, 차량군 프로파일, 충격파 프로파일 생성을 제안하였다. 특히 밀도, 차량군, 충격파 정보는 교통상황 판단에 효과적이나 기존 ITS환경에서는 생성이 불가능하였던 것들이다. 본 연구에서는 모든 차량에 센서가 부착되어 있을 경우를 가정한 가공방안을 제시하였고, 장착율이 100%가 아닐 경우, 장착율에따라수집데이터를전수화하여프로파일작성하는방안을향후과제로남겨둔다.