• 제목/요약/키워드: Clusters System

검색결과 841건 처리시간 0.029초

시각적 특징을 기반한 샷 클러스터링을 통한 비디오 씬 탐지 기법 (Video Scene Detection using Shot Clustering based on Visual Features)

  • 신동욱;김태환;최중민
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.47-60
    • /
    • 2012
  • 비디오 데이터는 구조화되지 않은 복합 데이터의 형태를 지닌다. 이러한 비디오 데이터의 효율적인 관리 및 검색을 위한 비디오 데이터 구조화의 중요성이 대두되면서 콘텐츠 내 시각적 특징을 기반으로 비디오 씬(scene)을 탐지하고자 하는 연구가 활발히 진행되었다. 기존의 연구들은 주로 색상 정보만을 이용하여 샷(shot) 간의 유사도 평가를 기반한 클러스터링(clustering)을 통해 비디오 씬을 탐지하고자 하였다. 하지만 비디오 데이터의 색상 정보는 노이즈(noise)를 포함하고, 특정 사물의 개입 등으로 인해 급격하게 변화하기 때문에 색상만을 특징으로 고려할 경우, 비디오 샷 혹은 씬에 대한 올바른 식별과 디졸브(dissolve), 페이드(fade), 와이프(wipe)와 같은 화면의 점진적인 전환(gradual transitions) 탐지는 어렵다. 이러한 문제점을 해결하기 위해, 본 논문에서는 프레임(frame)의 컬러 히스토그램과 코너 에지, 그리고 객체 컬러 히스토그램에 해당하는 시각적 특징을 기반으로 동일한 이벤트를 구성하는 의미적으로 유사한 샷의 클러스터링을 통해 비디오 씬을 탐지하는 방법(Scene Detector by using Color histogram, corner Edge and Object color histogram, SDCEO)을 제안한다. SDCEO는 샷 바운더리 식별을 위해 컬러 히스토그램 분석 단계에서 각 프레임의 컬러 히스토그램 정보를 이용하여 1차적으로 연관성 있는 연속된 프레임을 샷 바운더리로 병합한 후, 코너 에지 분석 단계에서 병합된 샷 내 처음과 마지막 프레임의 코너 에지 특징 비교를 통하여 샷 바운더리를 정제하여 최종 샷을 식별한다. 키프레임 추출 단계에서는 샷 내 프레임간 유사도 비교를 통해 모든 프레임과 가장 유사한 프레임을 각 샷을 대표하는 키프레임으로 추출한다. 그 후, 비디오 씬 탐지를 위해, 컬러 히스토그램과 객체 컬러 히스토 그램에 해당하는 프레임의 시각적 특징을 기반으로 상향식 계층 클러스터링 방법을 이용하여 의미적인 연관성을 지니는 샷의 군집화를 통해 비디오 씬을 탐지하는 방법이다. 본 논문에서는 SDCEO의 프로토 타입을 구축하고 3개의 비디오 데이터를 이용한 실험을 통하여 SDCEO의 효율성을 평가하였고 샷 바운더리 식별의 성능의 정확도는 평균 93.3%, 비디오 씬 탐지 성능의 정확도는 평균 83.3%로 만족할만한 성능을 보였다.

데이터 분석을 통한 UX 방법론 연구 고객 세그먼트 분류를 통한 페르소나 도출을 중심으로 (UX Methodology Study by Data Analysis Focusing on deriving persona through customer segment classification)

  • 이슬이;박도형
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.151-176
    • /
    • 2021
  • 정보기술 산업이 발전됨에 따라 다양한 종류의 데이터가 생겨나고 있고 이를 가공하여 산업에 활용하는 것이 필수인 시대가 되었다. 온 오프라인 상에서 수집된 다양한 디지털 데이터를 분석하여 활용하는것은 산업 내의 고객에게 적합한 경험을 제공하기 위해서 꼭 필요한 과정이다. 새로운 비즈니스, 제품, 서비스를 창출하기 위해서는다방면에서 수집된 고객 데이터를 활용하여잠재고객의 니즈를 깊게 파악하고 행동패턴을 분석하여 숨겨진 욕망의 신호를 잡아내는것이 필수이다. 그러나 효과적인 서비스 개발을 위해서 병행해서 진행되어야 할 데이터 분석, UX 방법론을 활용한 연구는 각각 따로 진행되고 있고 산업 내의 활용 예시가 부족한 것이 사실이다. 본 연구에서는 데이터 분석 방법과 UX 방법론을 응용하여 하나의 프로세스를 제작하였다. 행복을 주제로 진행된 설문조사에서 추출된 고객 데이터를 활용하여 고객의 특성을 파악하기 위한 데이터 분석을 진행하였다. 요인, 회귀분석을 실시하여 행복 데이터 설문의 요인 간의 연관 관계를 확인하였다. 그 다음 연관 관계를 군집을 분류하고 가장 최적의 군집 수를 추출하여분류하였다. 이러한 결과를 바탕으로 교차분석을 진행하여 군집 별로 인구통계학적 특성을 확인하였다. 세그먼트를 분류하기 전 서비스 정의를 하기 위하여 뉴스 기사 및 SNS 문장들을 바탕으로 텍스트 마이닝을 통해 주요 키워드를 바탕으로 아이디어를 도출하였고 이중에 가장 타당한 서비스를 선택하였다. 이러한 결과를 바탕으로 세그먼트및 목표 고객을 선정한 후 세그먼트의 특성대로 대상자를 선정하여 인터뷰를진행하였다. 그 후 특성 및 프로파일정보를 활용하여 페르소나를 제작하여고객의 행동과 최종 목표를 서술하였다. 일반적인페르소나와 데이터를 활용한 페르소나를 비교하여 각각의 특성을 비교 분석하였다. 본 연구를 통해 도출된 프로세스는 다변화되는 서비스의 변화 상황에서 적절한 타겟 고객의 정의 및 정확한 분류 체계로 나뉘어진 고객군을파악 할 수 있는 방법을 제시 한 것에 의의가 있다.

효과적인 인터랙티브 비디오 저작을 위한 얼굴영역 기반의 어노테이션 방법 (Annotation Method based on Face Area for Efficient Interactive Video Authoring)

  • 윤의녕;가명현;조근식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.83-98
    • /
    • 2015
  • TV를 보면서 방송에 관련된 정보를 검색하려는 많은 시청자들은 정보 검색을 위해 주로 포털 사이트를 이용하고 있으며, 무분별한 정보 속에서 원하는 정보를 찾기 위해 많은 시간을 소비하고 있다. 이와 같은 문제를 해결하기 위한 연구로써, 인터랙티브 비디오에 대한 연구가 활발하게 진행되고 있다. 인터랙티브 비디오는 일반적인 비디오에 추가 정보를 갖는 클릭 가능한 객체, 영역, 또는 핫스팟을 동시에 제공하여 사용자와 상호작용이 가능한 비디오를 말한다. 클릭 가능한 객체를 제공하는 인터랙티브 비디오를 저작하기 위해서는 첫째, 증강 객체를 생성하고, 둘째, 어노테이터가 비디오 위에 클릭 가능한 객체의 영역과 객체가 등장할 시간을 지정하고, 셋째, 객체를 클릭할 때 사용자에게 제공할 추가 정보를 지정하는 과정을 인터랙티브 비디오 저작 도구를 이용하여 수행한다. 그러나 기존의 저작 도구를 이용하여 인터랙티브 비디오를 저작할 때, 객체의 영역과 등장할 시간을 지정하는데 많은 시간을 소비하고 있다. 본 논문에서는 이와 같은 문제를 해결하기 위해 유사한 샷들의 모임인 샷 시퀀스의 모든 샷에서 얼굴 영역을 검출한 샷 시퀀스 메타데이터 모델과 객체의 어노테이션 결과를 저장할 인터랙티브 오브젝트 메타데이터 모델, 그리고 어노테이션 후 발생될 수 있는 부정확한 객체의 위치 문제를 보완할 사용자 피드백 모델을 적용한 얼굴영역을 기반으로 하는 새로운 형태의 어노테이션 방법을 제안한다. 마지막으로 제안한 어노테이션 방법의 성능을 검증하기 위해서 인터랙티브 비디오 저작 시스템을 구현하여 기존의 저작도구들과 저작 시간을 비교하였고, 사용자 평가를 진행 하였다. 비교 분석 결과 평균 저작 시간이 다른 저작 도구에 비해 2배 감소하였고, 사용자 평가 결과 약 10% 더 유용한다고 평가 되었다.

도로수송부문 온실가스 배출량 산정을 위한 간선 및 지선도로상의 교통량 추정시스템 개발 (Development of Traffic Volume Estimation System in Main and Branch Roads to Estimate Greenhouse Gas Emissions in Road Transportation Category)

  • 김기동;이태정;정원석;김동술
    • 한국대기환경학회지
    • /
    • 제28권3호
    • /
    • pp.233-248
    • /
    • 2012
  • The national emission from energy sector accounted for 84.7% of all domestic emissions in 2007. Of the energy-use emissions, the emission from mobile source as one of key categories accounted for 19.4% and further the road transport emission occupied the most dominant portion in the category. The road transport emissions can be estimated on the basis of either the fuel consumed (Tier 1) or the distance travelled by the vehicle types and road types (higher Tiers). The latter approach must be suitable for simultaneously estimating $CO_2$, $CH_4$, and $N_2O$ emissions in local administrative districts. The objective of this study was to estimate 31 municipal GHG emissions from road transportation in Gyeonggi Province, Korea. In 2008, the municipalities were consisted of 2,014 towns expressed as Dong and Ri, the smallest administrative district unit. Since mobile sources are moving across other city and province borders, the emission estimated by fuel sold is in fact impossible to ensure consistency between neighbouring cities and provinces. On the other hand, the emission estimated by distance travelled is also impossible to acquire key activity data such as traffic volume, vehicle type and model, and road type in small towns. To solve the problem, we applied a hierarchical cluster analysis to separate town-by-town road patterns (clusters) based on a priori activity information including traffic volume, population, area, and branch road length obtained from small 151 towns. After identifying 10 road patterns, a rule building expert system was developed by visual basic application (VBA) to assort various unknown road patterns into one of 10 known patterns. The expert system was self-verified with original reference information and then objects in each homogeneous pattern were used to regress traffic volume based on the variables of population, area, and branch road length. The program was then applied to assign all the unknown towns into a known pattern and to automatically estimate traffic volumes by regression equations for each town. Further VKT (vehicle kilometer travelled) for each vehicle type in each town was calculated to be mapped by GIS (geological information system) and road transport emission on the corresponding road section was estimated by multiplying emission factors for each vehicle type. Finally all emissions from local branch roads in Gyeonggi Province could be estimated by summing up emissions from 1,902 towns where road information was registered. As a result of the study, the GHG average emission rate by the branch road transport was 6,101 kilotons of $CO_2$ equivalent per year (kt-$CO_2$ Eq/yr) and the total emissions from both main and branch roads was 24,152 kt-$CO_2$ Eq/yr in Gyeonggi Province. The ratio of branch roads emission to the total was 0.28 in 2008.

'청수' 포도의 수형에 따른 수체 생육 및 과실 특성 (Growth and Fruit Characteristics of 'Cheongsoo' Grape in Different Trellis Systems)

  • 김수진;박서준;정성민;노정호;허윤영;남종철;박교선
    • 원예과학기술지
    • /
    • 제32권4호
    • /
    • pp.427-433
    • /
    • 2014
  • 수형은 포도 과실의 품질과 수확량에 영향을 주는 주요한 요인이다. 또한 몇몇 포도 품종들은 다양한 기후와 토양조건에서 고유한 특성을 드러내기 위해 적합한 수형을 요구한다. 본 연구는 '청수' 품종의 우리나라에서의 재배에 적합한 수형을 평가하기 위해 수행되었다. '청수' 품종의 수형에 따른 광 환경을 비교한 결과 수광량이 높은 수형은 커튼형, 이중커튼형, 개량일자형 순이었다. 최대 광량의 경우 개량일자형은 약 $670{\mu}mol{\cdot}m^{-2}{\cdot}s^{-1}$인데 비해 커튼형과 이중커튼형은 약 1,654와 $1,649{\mu}mol{\cdot}m^{-2}{\cdot}s^{-1}$로 나타났다. 대기온도는 세 수형 모두 비슷하게 나타났다. 광도 $1,500{\mu}mol{\cdot}m^{-2}{\cdot}s^{-1}$에서 개량일자형은 이산화탄소동화율이 $8.3{\mu}mol{\cdot}m^{-2}{\cdot}s^{-1}$인데 비해 커튼형과 이중커튼형은 13.4, $13.7{\mu}mol{\cdot}m^{-2}{\cdot}s^{-1}$로 나타났다. 주지횡단면면적과 발아율은 세 수형간에 유의한 차이를 보이지 않았다. 눈의 수와 신초 수는 54.4개와 47.0으로 이중커튼형에서 가장 많았으며 커튼형에서는 눈의 수는 34.7개, 신초 수는 31.3개로 가장 적었다. 신초의 길이는 개량일자형의 경우 243.9cm로 가장 길었으며 이중커튼형은 151.5cm로 가장 짧았다. 초생엽과 부초엽의 엽면적의 경우에도 개량일자형이 다른 수형에 비해 월등하게 높게 나타났다. 수관 내부 잎 수와 전체 잎에 대한 수관 내부 잎의 비율은 이중커튼형이 높게 나타났다. 과립 무게, 과립의 종경과 횡경은 수형간 차이가 나타나지 않았다. 그러나 과방중은 이중커튼형에서 203.66g으로 가장 높았으며 개량일자형에서는 130.10g으로 가장 낮았다. 나무당 과방수 또한 이중커튼형이 136.8개로 개량일자형의 86.28나 커튼형의 97.42개에 비해 많았다. 산도는 이중커튼형에서 0.45로 다른 수형에 비해 유의하게 낮았다. 따라서 '청수' 품종은 단위면적당 수확량을 높이면서도 과실의 품질이 저해되지 않는 이중커튼형으로 수형을 관리하는 것이 적합한 것으로 판단되며 이는 '청수' 품종의 농가 보급 및 재배에 중요한 정보가 될 것이다.

중부지역 참깨 간작 들깨 재배시 파종기가 수량 및 품질에 미치는 영향 (Effects of Seeding Date on Growth, Yield, and Fatty Acid Content of Perilla Inter-cropped with Sesame in Central Korea)

  • 김영상;김기현;윤철구;허윤선;김익제;김영호;송용섭;이명희
    • 한국작물학회지
    • /
    • 제66권2호
    • /
    • pp.138-145
    • /
    • 2021
  • 본 연구는 중부지역에서 참깨와 들깨의 작부체계를 개발하기 위하여 중부지역에 적합한 파종기를 설정하고 이에 적합한 참깨 간작 들깨의 작부체계를 개발하기 위하여 수행하였다. 전작물로 재배되는 참깨가 후작물 들깨에 미치는 영향과 파종기에 따른 수량성을 검토하고 참깨 간작 들깨 작부체계를 위한 재배방법을 개발하였다. 참깨 재배 중 들깨 간작을 위하여 전작물로 재배되는 참깨의 특성은 조생이며 경장이 짧은 품종이 적당하였으며, 후작으로 재배되는 들깨의 파종기를 설정하기 위하여 6월 중순, 6월 하순, 7월 초순에 들깨를 참깨 사이에 파종한 결과 6월 중순 파종에서 화방군수, 군당삭수 및 수량이 많았으며 파종기가 늦어질수록 들깨 수량은 현저히 낮아졌다. 전작물 생육특성에 따른 영향으로는 조생이며 경장이 짧은 참깨 품종 재배지에서 들깨의 생육 및 수량이 우수하였다. 참깨 간작 들깨작부체계 개선을 위하여 한 줄 재배(조간×주간) 110×20 cm와 두 줄 재배(조간×주간) 40×40 cm로 재배한 결과 두 줄재배에서 수량이 많았다. 이상의 결과로부터 중부지역에 적합한 참깨 간작 들깨 재배는 전작으로 재배되는 참깨는 조생이며 경장이 작은 품종을 선정하여 재배하고 들깨는 두 줄로 참깨사이에 간작으로 6월 중순에 파종하는 방법이 적합할 것으로 판단되었다.

U-마켓에서의 사용자 정보보호를 위한 매장 추천방법 (A Store Recommendation Procedure in Ubiquitous Market for User Privacy)

  • 김재경;채경희;구자철
    • Asia pacific journal of information systems
    • /
    • 제18권3호
    • /
    • pp.123-145
    • /
    • 2008
  • Recently, as the information communication technology develops, the discussion regarding the ubiquitous environment is occurring in diverse perspectives. Ubiquitous environment is an environment that could transfer data through networks regardless of the physical space, virtual space, time or location. In order to realize the ubiquitous environment, the Pervasive Sensing technology that enables the recognition of users' data without the border between physical and virtual space is required. In addition, the latest and diversified technologies such as Context-Awareness technology are necessary to construct the context around the user by sharing the data accessed through the Pervasive Sensing technology and linkage technology that is to prevent information loss through the wired, wireless networking and database. Especially, Pervasive Sensing technology is taken as an essential technology that enables user oriented services by recognizing the needs of the users even before the users inquire. There are lots of characteristics of ubiquitous environment through the technologies mentioned above such as ubiquity, abundance of data, mutuality, high information density, individualization and customization. Among them, information density directs the accessible amount and quality of the information and it is stored in bulk with ensured quality through Pervasive Sensing technology. Using this, in the companies, the personalized contents(or information) providing became possible for a target customer. Most of all, there are an increasing number of researches with respect to recommender systems that provide what customers need even when the customers do not explicitly ask something for their needs. Recommender systems are well renowned for its affirmative effect that enlarges the selling opportunities and reduces the searching cost of customers since it finds and provides information according to the customers' traits and preference in advance, in a commerce environment. Recommender systems have proved its usability through several methodologies and experiments conducted upon many different fields from the mid-1990s. Most of the researches related with the recommender systems until now take the products or information of internet or mobile context as its object, but there is not enough research concerned with recommending adequate store to customers in a ubiquitous environment. It is possible to track customers' behaviors in a ubiquitous environment, the same way it is implemented in an online market space even when customers are purchasing in an offline marketplace. Unlike existing internet space, in ubiquitous environment, the interest toward the stores is increasing that provides information according to the traffic line of the customers. In other words, the same product can be purchased in several different stores and the preferred store can be different from the customers by personal preference such as traffic line between stores, location, atmosphere, quality, and price. Krulwich(1997) has developed Lifestyle Finder which recommends a product and a store by using the demographical information and purchasing information generated in the internet commerce. Also, Fano(1998) has created a Shopper's Eye which is an information proving system. The information regarding the closest store from the customers' present location is shown when the customer has sent a to-buy list, Sadeh(2003) developed MyCampus that recommends appropriate information and a store in accordance with the schedule saved in a customers' mobile. Moreover, Keegan and O'Hare(2004) came up with EasiShop that provides the suitable tore information including price, after service, and accessibility after analyzing the to-buy list and the current location of customers. However, Krulwich(1997) does not indicate the characteristics of physical space based on the online commerce context and Keegan and O'Hare(2004) only provides information about store related to a product, while Fano(1998) does not fully consider the relationship between the preference toward the stores and the store itself. The most recent research by Sedah(2003), experimented on campus by suggesting recommender systems that reflect situation and preference information besides the characteristics of the physical space. Yet, there is a potential problem since the researches are based on location and preference information of customers which is connected to the invasion of privacy. The primary beginning point of controversy is an invasion of privacy and individual information in a ubiquitous environment according to researches conducted by Al-Muhtadi(2002), Beresford and Stajano(2003), and Ren(2006). Additionally, individuals want to be left anonymous to protect their own personal information, mentioned in Srivastava(2000). Therefore, in this paper, we suggest a methodology to recommend stores in U-market on the basis of ubiquitous environment not using personal information in order to protect individual information and privacy. The main idea behind our suggested methodology is based on Feature Matrices model (FM model, Shahabi and Banaei-Kashani, 2003) that uses clusters of customers' similar transaction data, which is similar to the Collaborative Filtering. However unlike Collaborative Filtering, this methodology overcomes the problems of personal information and privacy since it is not aware of the customer, exactly who they are, The methodology is compared with single trait model(vector model) such as visitor logs, while looking at the actual improvements of the recommendation when the context information is used. It is not easy to find real U-market data, so we experimented with factual data from a real department store with context information. The recommendation procedure of U-market proposed in this paper is divided into four major phases. First phase is collecting and preprocessing data for analysis of shopping patterns of customers. The traits of shopping patterns are expressed as feature matrices of N dimension. On second phase, the similar shopping patterns are grouped into clusters and the representative pattern of each cluster is derived. The distance between shopping patterns is calculated by Projected Pure Euclidean Distance (Shahabi and Banaei-Kashani, 2003). Third phase finds a representative pattern that is similar to a target customer, and at the same time, the shopping information of the customer is traced and saved dynamically. Fourth, the next store is recommended based on the physical distance between stores of representative patterns and the present location of target customer. In this research, we have evaluated the accuracy of recommendation method based on a factual data derived from a department store. There are technological difficulties of tracking on a real-time basis so we extracted purchasing related information and we added on context information on each transaction. As a result, recommendation based on FM model that applies purchasing and context information is more stable and accurate compared to that of vector model. Additionally, we could find more precise recommendation result as more shopping information is accumulated. Realistically, because of the limitation of ubiquitous environment realization, we were not able to reflect on all different kinds of context but more explicit analysis is expected to be attainable in the future after practical system is embodied.

대용량 LiDAR 데이터 보간을 위한 MPI 격자처리 과정의 작업량 발란싱 기법 (Task Balancing Scheme of MPI Gridding for Large-scale LiDAR Data Interpolation)

  • 김선영;이희진;박승규;오상윤
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.1-10
    • /
    • 2014
  • 본 논문은 MPI를 이용하여 LiDAR 데이터를 처리하는 방식에서 각 코어간의 통신을 최소화하고 작업량 발란싱을 위해 격자크기를 다양하게 하여 LiDAR 데이터의 보간 처리 성능을 향상시키는 기법을 제안한다. 항공기 등을 통해 얻어진 LiDAR 데이터는 3차원 공간정보로서 정밀한 관측 성능과 거리 정보를 포함하여 지리정보, 기상관측 등 다양한 분야에 활용되고 있다. 하지만 필요보다 높은 해상도의 데이터를 사용하거나, 비지표정보를 포함하는 경우를 위해 획득된 LiDAR 데이터를 필터링 하여 사용하게 되며, 필터링된 데이터를 사용하기 위해서는 주변을 탐색할 수 있는 자료구조를 이용해서 보간법을 수행하여야만 데이터가 재구성된다. 데이터의 규모에 비례하여 처리시간도 증가하기 때문에 이를 해결하기 위해 MPI를 이용한 고성능 병렬 처리 방식 연구가 활발히 진행되고 있다. 그러나 기존에 병렬 처리를 사용한 기존의 방식은 각 노드에 할당된 데이터의 밀도가 달라 성능 저하가 생길 수 있으며, 경계값 불일치를 해결하기 위해 노드간의 통신이 많아지는 단점을 가진다. 제안한 방법의 효과를 검증하기 위해 기존 연구에서 제안된 방식들과 처리 성능을 비교하였으며, 데이터에 따라 최대 4.2배의 실행시간 단축되는 것을 확인하였다.

유전자 알고리즘을 이용한 서울시 군집화 최적 변수 선정 (Selection of Optimal Variables for Clustering of Seoul using Genetic Algorithm)

  • 김형진;정재훈;이정빈;김상민;허준
    • 대한공간정보학회지
    • /
    • 제22권4호
    • /
    • pp.175-181
    • /
    • 2014
  • 정부 3.0이라는 새로운 정부운영 계획과 함께 다양한 공공정보를 민간이 활용할 수 있게 되었으며, 특히 서울은 이러한 행정정보 공개 및 활용을 선도하고 있다. 공개된 행정정보를 통해 각 지역을 특징짓는 행정요소를 발견할 경우, 각종 행정정책을 위한 의사결정 수단에 반영할 수 있을 뿐만 아니라 특정 지역의 고객 특성을 파악하여 특화된 서비스나 상품을 판매하는 마케팅 수단으로도 사용할 수 있을 것으로 사료된다. 하지만, 방대한 양의 행정자료로부터 각 군집의 특성을 명확히 구분할 수 있는 최적의 조합을 찾는 과정은 조합최적화 문제로서 상당한 연산량을 요구한다. 본 연구에서는 서울시에서 제공하는 다차원 행정자료로부터 서울시를 대표하는 문화 산업의 중심인 서초구, 강남구, 송파구 등의 강남 3구를 다른 지역과 효과적으로 구분하는 행정요인를 찾고자 하였다. 방대한 양의 행정정보로부터 두 군집간의 차이점을 극대화하는 요인을 선별하기 위한 최적화 방법으로 유전자 알고리즘을 이용하였으며, 군집간 차이를 계산하는 척도로는 Dunn 지수를 이용하였다. 또한 유전자 알고리즘의 연산속도의 향상을 위해 Microsoft Azure에서 제공하는 cloud computing을 이용한 분산처리를 수행하였다. 자료로는 통계청으로 부터 취득한 총 718개의 행정자료를 이용하였으며, 그 중 28개가 최적 변수로 선정되었다. 검증을 위해 선정된 28개의 변수를 입력값으로 Ward의 최소분산법 및 K-means 알고리즘을 통한 군집화를 수행한 결과 두 경우 모두 강남 3구가 다른 지역으로부터 효과적으로 분류됨을 확인하였다.

Ovarian transcriptomic analysis of Shan Ma ducks at peak and late stages of egg production

  • Zhu, ZhiMing;Miao, ZhongWei;Chen, HongPing;Xin, QingWu;Li, Li;Lin, RuLong;Huang, QinLou;Zheng, NenZhu
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제30권9호
    • /
    • pp.1215-1224
    • /
    • 2017
  • Objective: To assess the differences in ovarian transcriptomes in Shan Ma ducks between their peak and late stages of egg production, and to obtain new transcriptomic data of these egg-producing ducks. Methods: The Illumina HiSeq 2000 system was used for high throughput sequencing of ovarian transcriptomes from Shan Ma ducks at their peak or late stages of egg production. Results: Greater than 93% of the sequencing data had a base quality score (Q score) that was not less than 20 (Q20). From ducks at their peak stage of egg production, 42,782,676 reads were obtained, with 4,307,499,083 bp sequenced. From ducks at their late stage of egg production, 45,316,166 reads were obtained, with 4,562,063,363 bp sequenced. A comparison of the two datasets identified 2,002 differentially expressed genes, with 790 upregulated and 1,212 downregulated. Further analysis showed that 1,645 of the 2,002 differentially expressed genes were annotated in the non-redundant (NR) database, with 646 upregulated and 999 downregulated. Among the differentially expressed genes with annotations in the NR database, 696 genes were functionally annotated in the clusters of orthologous groups of proteins database, involving 25 functional categories. One thousand two hundred four of the differentially expressed genes with annotations in the NR database were functionally annotated in the gene ontology (GO) database, and could be divided into three domains and 56 categories. The three domains were cellular component, molecular function, and biological process. Among the genes identified in the GO database, 451 are involved in development and reproduction. Analysis of the differentially expressed genes with annotations in the NR database against the Kyoto encyclopedia of genes and genomes database revealed that 446 of the genes could be assigned to 175 metabolic pathways, of which the peroxisome proliferator-activated receptor signaling pathway, insulin signaling pathway, fructose and mannose metabolic pathways, gonadotropin releasing hormone signaling pathway and transforming growth factor beta signaling pathway were significantly enriched. Conclusion: The differences in ovarian transcriptomes in Shan Ma ducks between their peak and late stages of egg production were elucidated, which greatly enriched the ovarian transcriptomic information of egg-producing ducks.