• 제목/요약/키워드: Visual sequence

검색결과 257건 처리시간 0.028초

비디오속의 얼굴추적 및 PCA기반 얼굴포즈분류와 (2D)2PCA를 이용한 얼굴인식 (Face Tracking and Recognition in Video with PCA-based Pose-Classification and (2D)2PCA recognition algorithm)

  • 김진율;김용석
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.423-430
    • /
    • 2013
  • 통상의 얼굴인식은 사람이 똑바로 카메라를 응시해야 하거나, 혹은 이동하는 통로의 정면과 같이 특정 얼굴포즈를 취득할 수 있는 위치에 카메라를 설치하는 등 통제적인 환경에서 이루어진다. 이러한 제약은 사람에게 불편을 초래하고 얼굴인식의 적용 범위를 제한하는 문제가 있다. 본 논문은 이러한 기존방식의 한계를 극복하기 위하여 대상이 특별한 제약 없이 자유롭게 움직이더라도 동영상 내에서 대상의 얼굴을 추적하고 얼굴인식을 하는 방법을 제안한다. 먼저 동영상 속의 얼굴은 IVT(Incremental Visual Tracking) 추적기를 사용하여 지속적으로 추적이 되며 이때 얼굴의 크기변화와 기울기가 보상이 되어 추출이 된다. 추출된 얼굴영상은 사람과 카메라의 각도를 특정각도로 제한하지 않았으므로 다양한 포즈를 가지게 되며 따라서 얼굴인식을 하기 위해서 포즈에 대한 판정이 선행되어야 한다. 본 논문에서는 PCA(Principal Component Analysis)기반의 얼굴포즈판정방법을 사용하여 추적기에서 추출된 이미지가 5개 포즈별 DB속의 학습된 포즈와 유사한 것으로 판정될 때만 얼굴인식을 수행하여 인식률을 높이는 방법을 제안하였다. 얼굴인식에서는 PCA, 2DPCA, $(2D)^2PCA$의 인식알고리즘을 사용하여 얼굴인식률과 수행시간을 비교 제시하였다.

애니메이션 창세기 첫 페이지의 오류, 그 기원과 수정 (Desperately Seeking an Icon (with 8 Legs):)

  • 나호원
    • 만화애니메이션 연구
    • /
    • 통권45호
    • /
    • pp.417-434
    • /
    • 2016
  • 알타미라 동굴의 다리 여덟 달린 멧돼지 벽화는 움직임을 표현하고자 하는 인류의 오랜 욕망을 보여주는 예로 제시되곤 한다. 그러나 여덟 개의 다리는 서로 다른 시기에 그려진, 이른바 더블 레이어의 결과물이다. 그럼에도 불구하고 알타미라 동굴벽화를 애니메이션의 시원과 결부시키는 설명은 별다른 의문이나 검증, 출처의 인용 등이 없이 꾸준히 재생산되고 있다. 여러 개의 다리를 움직임과 연결시키는 것은 시대를 초월한 시지각과는 무관하다. 그것은 특정한 시기에 발명된 움직임 표현 코드로 보아야 한다. 여기에는 19세기 후반에 시도된 연속촬영술, 그 중에서도 에티엔 쥘 마레의 시간사진술이 결정적인 역할을 한다. 일련의 연속적인 움직임들을 하나의 프레임 속에 겹쳐서 인화한 마레의 사진술은 20세기 초에 뒤샹과 발라를 비롯한 아티스트들의 회화 작업에 반영되면서 움직임 표현 코드로 형성되었다. 그 무렵부터 등장하기 시작한 애니메이션 매뉴얼들도 움직임을 분석하고 구현하기 위한 방법으로 마레의 시간사진술 이미지를 도입하였다. 결국 다리 여덟 개의 알타미라 동굴벽화를 움직임의 표현이라고 이해하는 것은 오늘날의 시각 코드를 통해 과거를 바라보고자 하는 오류이다.

Molecular Cloning and Expression of Forkhead Transcription Factor O1 Gene from Pig Sus scrofa

  • Pang, Weijun;Sun, Shiduo;Bai, Liang;Yang, Gongshe
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제21권4호
    • /
    • pp.499-509
    • /
    • 2008
  • Foxo1 plays an important role in the integration of hormone-activated signaling pathways with the complex transcriptional cascade that promotes preadipocyte differentiation of clonal cell lines from rodents. We isolated the full-length cDNA of porcine FoxO1 gene using RACE, confirmed by visual Northern blotting. The deduced amino acids indicated 94% and 90% identities with the corresponding human and mice aa. Analysis of the aa sequence, showed that it included a Forkhead domain (aa 167-247), a transmembrane structure domain (aa 90-113), a LXXLL motif (aa 469-473), and 51 Ser, 8 Thr, and 4 Tyr phosphorylation sites, indicating a potential important role for FoxO1 transcriptional activity in vivo. Using the IMpRH panel, we mapped FoxO1 gene to chromosome 11p13. Our data provide basic molecular information useful for the further investigation on the function of FoxO1 gene. Time-course analysis of FoxO1 expressions indicated that levels of mRNA and protein gradually increased from day 0 to 3, and it reached almost maximal level at day 3, then decreased from day 5 to 7 in porcine primary preadipocyte differentiation. After induction by IGF-1, GPDH activity and accumulation of lipid increased, however, expressions of FoxO1 mRNA and protein were inhibited in a dose dependent manner. These results suggest that FoxO1 takes part in porcine preadipocyte differentiation and expressions of FoxO1 were regulated by IGF-1.

장면 전환 기법을 이용한 동영상 검색 시스템 설계 (Design of Moving Picture Retrieval System using Scene Change Technique)

  • 김장희;강대성
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.8-15
    • /
    • 2007
  • 최근 멀티미디어 데이터를 효율적으로 전송, 저장 관리 및 검색하는 기술이 중요한 핵심 기술로 대두되고 있다. 그 중에서 멀티미디어 정보 검색의 경우 사용자가 원하는 정보를 표현할 수 있는 사용자 인터페이스 기술과 원하는 정보를 사용자에게 신속하고 정확하게 보여주는 기술의 필요성이 증대하고 있다. 본 논문에서는 MPEG으로 압축된 영상 정보에서 장면의 전환점인 컷을 효과적으로 검출하여 동영상을 분할하는 기법을 제안한다. 컷 검출(Cut detection)은 MPEG 비디오 시퀀스에서 동영상을 분할하는 가장 기본적이면서 중요한 기초 작업이며, 비디오 색인 및 검색을 위한 첫 번째 단계이다. 기존의 방법들은 프레임간을 비교하기 때문에 물체의 빠른 움직임이나 카메라의 움직임, 후레쉬의 섬광 등 화면 변화에 따라 오검출이 생기는 단점이 있다. 제안하는 컷 검출 기법은 먼저 입력영상을 DCT의 DC를 이용하여 샷을 검출한다. 이렇게 검출된 샷으로 데이터베이스를 구성하고, MPEG-7의 시각 기술자 중 HMMD 컬러 모델과 에지 히스토그램을 사용하여 영상에서 특징을 추출하였다. 그리고 제안하는 매칭 기법에 따라 단계별 검색을 수행하였다. 이 실험을 통해서 기존 방법들보다 높은 검색률을 보이는 개선된 동영상 분할 시스템을 설계하였다.

어포던스 디자인 관점의 안전가이드라인 개발 모형 연구 (A Study on the Model of Safety Guideline based on Affordance Design)

  • 김회광;김효일
    • 디지털융복합연구
    • /
    • 제15권11호
    • /
    • pp.447-454
    • /
    • 2017
  • 인간의 욕구는 기본적인 생활환경을 구성하는 요인에서부터 출발하게 된다. 안전 가이드라인 개발 모형은 행동유도를 통해 위협 요인의 발생 시점에서 집단 심리와 체계적인 환경에서 벗어난 의식의 절단에서 출발하게 된다. 안전 가이드라인 설계와 방법론은 시퀀스별 모형으로 주관화와 객관화가 반복해서 도출되어야 하며, 서비스 디자인 방법론을 통해 공공 서비스의 시간 순차적인 방향으로 설계되어야 한다. 다양하고 복잡한 위협요인은 감성경험과 사용자경험, 기술경험의 가치를 반영한 모형으로 구축하기 위해 사용자 관점, 관리자 관점의 모형으로 인사이트를 도출하고 안전 가이드라인 개발모형으로 추출하고자 한다. 명확한 설계와 자료조사를 통해 일반 사용자의 수평적, 수직적 사고의 문제를 전환시키고, 이해관계자의 프로토타입 도출과 인사이트를 도출하게 된다. 이렇게 도출된 인사이트는 안전 가이드라인 개발방법론은 동일한 문제의식에서 출발된 다차원 서비스 모형으로 구현될 수 있다.

도시가로환경 구성요소의 우선순위에 관한 연구 - 아이트래킹 실험을 통한 관심영역설정 분석을 중심으로 - (A Study on the Priorities of Urban Street Environment Components - Focusing on An Analysis of AOI (Area of Interest) Setup through An Eye-tracking Experiment -)

  • 이선화;이창노
    • 한국실내디자인학회논문집
    • /
    • 제25권1호
    • /
    • pp.73-80
    • /
    • 2016
  • Street is the most fundamental component of city and place to promote diverse actions of people. Pedestrians gaze at various street environments. A visual gaze means that there are interesting elements and these elements need to be preferentially improved in the street environment improvement project. Therefore, this study aims to set up the priorities of street environment components by analyzing eye movements from a pedestrian perspective. In this study, street environment components were classified into road, street facility, building(facade) and sky and as street environment images, three "Streets of Youth" situated in Gwangbok-ro, Seomyeon and Busan University of Busan were selected. The experiment targeted 30 males and females in their twenties to forties. After setting the angle of sight through a calibration test, an eye-tracking experiment regarding the three images was conducted. Lastly, the subjects were asked to fill in questionnaires. The following three conclusions were obtained from the results of the eye-tracking experiment and the survey. First, building was the top priority of street environment components and it was followed by street facility, road and sky. Second, as components to be regarded as important, fast 'Sequence', many 'Fixation Counts' and 'Visit Counts', short 'Time to First Fixation' and long 'Fixation Duration' and 'Visit Duration' were preferred. Third, after voluntary eye movements, the subjects recognized the objects with the highest gaze frequency and the lowest gaze frequency.

The Effect of Acoustic Correlates of Domain-initial Strengthening in Lexical Segmentation of English by Native Korean Listeners

  • Kim, Sa-Hyang;Cho, Tae-Hong
    • 말소리와 음성과학
    • /
    • 제2권3호
    • /
    • pp.115-124
    • /
    • 2010
  • The current study investigated the role of acoustic correlates of domain-initial strengthening in lexical segmentation of a non-native language. In a series of cross-modal identity-priming experiments, native Korean listeners heard English auditory stimuli and made lexical decision to visual targets (i.e., written words). The auditory stimuli contained critical two word sequences which created temporal lexical ambiguity (e.g., 'mill#company', with the competitor 'milk'). There was either an IP boundary or a word boundary between the two words in the critical sequences. The initial CV of the second word (e.g., [$k_{\Lambda}$] in 'company') was spliced from another token of the sequence in IP- or Wd-initial positions. The prime words were postboundary words (e.g., company) in Experiment 1, and preboundary words (e.g., mill) in Experiment 2. In both experiments, Korean listeners showed priming effects only in IP contexts, indicating that they can make use of IP boundary cues of English in lexical segmentation of English. The acoustic correlates of domain-initial strengthening were also exploited by Korean listeners, but significant effects were found only for the segmentation of postboundary words. The results therefore indicate that L2 listeners can make use of prosodically driven phonetic detail in lexical segmentation of L2, as long as the direction of those cues are similar in their L1 and L2. The exact use of the cues by Korean listeners was, however, different from that found with native English listeners in Cho, McQueen, and Cox (2007). The differential use of the prosodically driven phonetic cues by the native and non-native listeners are thus discussed.

  • PDF

Realistic Building Modeling from Sequences of Digital Images

  • Song, Jeong-Heon;Kim, Min-Suk;Han, Dong-Yeob;Kim, Yong-Il
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2002년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.516-516
    • /
    • 2002
  • With the wide usage of LiDAR data and high-resolution satellite image, 3D modeling of buildings in urban areas has become an important research topic in the photogrammetry and computer vision field for many years. However the previous modeling has its limitations of merely texturing the image to the DSM surface of the study area and does not represent the relief of building surfaces. This study is focused on presenting a system of realistic 3D building modeling from consecutive stereo image sequences using digital camera. Generally when acquiring images through camera, various parameters such as zooming, focus, and attitude are necessary to extract accurate results, which in certain cases, some parameters have to be rectified. It is, however, not always possible or practical to precisely estimate or rectify the information of camera positions or attitudes. In this research, we constructed the collinearity condition of stereo images through extracting the distinctive points from stereo image sequence. In addition, we executed image matching with Graph Cut method, which has a very high accuracy. This system successfully performed the realistic modeling of building with a good visual quality. From the study, we concluded that 3D building modeling of city area could be acquired more realistically.

  • PDF

과학축전과 과학커뮤니케이션 : 1997년 4월‘과학의 달’행사를 중심으로 (Science Festival and Science Communication: A Case Study for the April 1997's Science Month in Korea)

  • 김학수
    • 기술혁신연구
    • /
    • 제6권1호
    • /
    • pp.99-127
    • /
    • 1998
  • The purposes of this study are first, to plan communication strategies for promoting the 1st National Science Festival and other events of the April 1997's Science Month in Koreas; second, to monitor communication activities done for those events; third, to evaluate effects of communication activities. Both the Ministry of Science and Technology and the Korea Science Foundation were arranged to execute our planned communication strategies. Basically we utilized the three sequences of human behavioral condition : Exposure, attention, and cognition. For planning, we suggested concrete communication strategies for each sequence, for example, first, those for bringing exposure to every event, second, those for bringing attention to the event, and third, those for bringing cognition of the event. Those communication strategies were suggested to use specifics of newspapers, television programs, radio programs, commercial and corporate magazines, electric visual sign advertisements on the street, and computer communication. For monitoring and evaluation, we used the same three sequences as the criteria. For example, we monitored and evaluated how much exposure, attention or cognition an event got or which specific medium contributed to exposure to, cognition of an event. For monitoring, graduate students were dispatched to examine each event through watching and interviewing. For evaluation, about 950 of event participants and non-participants were surveyed by means of face-to-face interview. Overall, we found that newspaper articles and television programs contributed a lot to people's exposure to events of the April 1997's Science Month. Especially, newspaper played a major role of heightening exposure. However, most events and/or their science and technology content failed to get salient attention and its following active cognition. The 1st National Science Festival attracted much exposure, but had some problems of disorder and commercialism. This sharp increase of exposure and some attention were believed to have reinforced people's, especially event participants' positive opinion of science and technology which is part of scientific culture.

  • PDF

원본정보 없이 씰영상의 추출이 가능한 이미지 워터마킹 기법 (A Watermarking Scheme to Extract the Seal Image without the Original Image)

  • 김원겸;이종찬;이원돈
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3885-3895
    • /
    • 2000
  • 디지털 이미지 기법과 디지털 네트웍의 출현으로 예술적 작품의 복사가 더욱 쉬워지고 있다. 이러한 창작품을 보호하기 위해 데이터 안에 저작권을 표시할 수 있는 표식이나 인식 가능한 데이터를 삽입하는 기술이 필요해지고 있고 지난 몇 년간 디지털 이미지나 오디오, 비디오 등의 멀티미디어 데이터에 저작권을 표시하기 위한 데이터나 기타 다른 정보를 삽입할 수 있는 많은 기법들이 제안되어 왔다. 본 논문에서는 이미지의 주파수 영역에 인식 가능한 패턴을 삽입하고 추출하는 워트마킹 기법을 제안한다. 또한 삽입된 워터마크를 원본이미지의 정보 없이 추출할 수 있도록 하여 임의의 사람이 워터마크 된 이미지로부터 가짜원본을 생성하는 것이 어렵도록 한다. 원본정보 없이 워터마크를 추출하기 위해서 화소의 원래 값을 예측하는 방법을 사용한다. 예측기법은 구하고자 하는 화소의 주위값을 평균한다는 것을 의미한다. 부가적으로 워터마크를 이미지 주파수 영역에 삽입함으로써 JPEG같은 손실압축바업에도 견딜 수 있도록 한다.

  • PDF