• 제목/요약/키워드: computation time reduction

검색결과 221건 처리시간 0.024초

주파수 영역에서의 움직임 예측 및 보상을 위한 재귀 방정식을 이용한 웨이브프런트 어레이 프로세서 (A Wavefront Array Processor Utilizing a Recursion Equation for ME/MC in the frequency Domain)

  • 이주흥;류철
    • 한국통신학회논문지
    • /
    • 제31권10C호
    • /
    • pp.1000-1010
    • /
    • 2006
  • 본 논문은 DCT(Discrete Cosine Transform) 기반의 움직임 예측 및 보상을 위한 새로운 연산 아키텍처를 제안한다. 기존 방식들의 경우 연산 시간의 단축을 위하여 2차원 DCT 계수의 희소성을 충분히 활용하지 못하고 있다. 본 논문에서는 DCT 영역에서의 효율적인 움직임 예측을 위한 재귀 방정식을 유도하고, 이를 바탕으로 PE로 구성된 WAP를 개발한다. 또한, 재귀 방정식을 이용하여, 움직임 예측된 영상이 저주파 성분부터 고주파 성분까지 다양한 주파수 대역을 갖는 것이 가능함을 보인다. WAP는 아키텍처의 수정 없이 로그형 탐색이나 3단계 탐색과 같은 다양한 움직임 예측 알고리즘들을 수행할 수 있으며, 이러한 특성들은 비디오 부호화와 복호화에 필요한 전력 소모를 줄이기 위하여 이용될 수 있다. 본 논문에서 제안한 WAP 아키텍처는 계산의 복잡도와 연산 시간을 효과적으로 감소시키며, SAD기준을 이용한 DCT 영역에서의 움직임 예측 및 보상 방식은 SAD 또는 SSD 기준을 이용한 공간 영역에서의 움직임 예측 및 보상 방식보다 높은 PSNR과 압축률을 제공함을 보여준다.

MODAPTS 기반 자동차 조립공정 부품공급 공수 산정에 관한 연구 (A Study on the Material Supply Man-Hour Computation based on MODAPTS in Automobile Assembly Line)

  • 장정환;장청윤;전욱;조용철;김유성;배상돈;강두석;이재웅;이창호
    • 대한안전경영과학회지
    • /
    • 제18권3호
    • /
    • pp.127-135
    • /
    • 2016
  • Korean automobile industrial is in a difficult situation because of more competitive global market and lower demand. Therefore, domestic as well as global automobile manufacturers are making greater efforts in cost reduction to strengthen the competitiveness. According to statistical data, logistics cost in domestic manufacturers is higher than advanced countries. In this study, we developed program to effectively manage standard time of procurement logistics, and confirm based on A-automobile factory data. For the purpose, we develop the system which is possible to manage standard time as well as calculate man-hour. Program is not just for calculating and managing standard man-hour, scenarios analysis function will be added to calculate benefit while introduce logistics automated equipment. In this study we propose scenario using AGV instead of electric motor while move component. In the scenario analysis, job constitution is changed, and then we use system to compare the result. We can confirm standard man-hour is reduced from 22.3M/H to 14.3M/H. In future research, it is necessary scenario analysis function, and develop algorithm with realistic constraint condition.

신경망 협업 필터링을 이용한 운동 추천시스템 (Exercise Recommendation System Using Deep Neural Collaborative Filtering)

  • 정우용;경찬욱;이승우;김수현;선영규;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권6호
    • /
    • pp.173-178
    • /
    • 2022
  • 최근, 소셜 네트워크 서비스에서 딥러닝을 활용한 추천시스템이 활발하게 연구되고 있다. 하지만 딥러닝을 이용한 추천시스템의 경우 콜드스타트 문제와 복잡한 연산으로 인해 늘어난 학습시간이 단점으로 존재한다. 본 논문에서는 사용자의 메타데이터를 활용하여 사용자 맞춤형 운동 루틴 추천 알고리즘을 제안한다. 본 논문에서 제안하는 알고리즘은 메타데이터(사용자의 키, 몸무게, 성, 등)를 입력받아 설계된 모델에 적용한다. 본 논문에서 제안한 운동 추천시스템 모델은 matrix factorization 알고리즘과 multi-layer perceptron을 활용한 neural collaborative filtering(NCF) 알고리즘을 기반으로 설계된다. 제안된 모델은 사용자 메타데이터와 운동 정보를 입력받아 학습을 진행한다. 학습이 완료된 모델은 특정 운동이 입력되면 사용자에게 추천도를 제공한다. 실험 결과에서 제안하는 운동 추천시스템 모델이 기존 NCF 모델보다 10% 추천 성능 향상과 50% 학습 시간 단축을 보였다.

Semi-Lagrangian 이류항 계산의 추적법 개선 (Improved Trajectory Calculation on the Semi-Lagrangian Advection Computation)

  • 박수완;백낙훈;유관우
    • 정보처리학회논문지A
    • /
    • 제16A권6호
    • /
    • pp.419-426
    • /
    • 2009
  • 일반적으로 사실성 있는 유체를 시뮬레이션하기 위해 Navier-Stokes 방정식을 사용한다. Euler 구조에서 Navier-Stokes 방정식을 풀 때, 이 류항은 비선형이어서 계산이 복잡하기 때문에 근사화한 모델로 Semi-Lagrangian 방법을 사용한다. Semi-Lagrangian 방법에서는 먼저 이류하 는 위치를추적하고, 추적한 위치에서 값을 보간해서 사용한다. Stam이 제안한 방법으로 계산할 경우, 이 과정에서 수치적 소실이 많이 발생하 기 때문에 수치적 소실을 보정하려는 노력들이 있어 왔다. 그러나 대부분의 경우에 보간하는 과정에서의 소실을 줄이려는 노력이거나, 입자를 같이 사용하는 방법이었다. 따라서 본 논문에서는 Euler 구조에서 다른 추가나 변형을 가하지 않고 이류항의 연산에서 추적법을 개선함으로 수 치적 소실을 줄이는 방법을 제안한다. 우리의 방법에서는 현재 격자의 속도로 역추적하는 기존의 방법이 아니라, 현재의 격자로 오게 될 속도 를 가진 격자를 찾아서, 그 격자의 물리량들을 선형 보간하여 사용한다. 이는 직관적으로 생각할 때, 어느 지점의 물리량은 그 지점의 속도로 인해 다음 단계에 다른 지점에 있게 된다는 사실을 그대로 적용한 것이다. 본 논문에서 제안한 방법으로 기체를 시뮬레이션 했을 때 수치적 소 실이 줄었으며, 그로 인해 사실성을 높이면서도 실시간 처리가 가능했다.

UHD 영상의 실시간 처리를 위한 고성능 HEVC SAO 부호화기 하드웨어 설계 (Hardware Design of High-Performance SAO in HEVC Encoder for Ultra HD Video Processing in Real Time)

  • 조현표;박승용;류광기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.271-274
    • /
    • 2014
  • 본 논문에서는 UHD급 영상의 실시간 처리를 위한 고성능 HEVC(High Efficiency Video Coding) SAO(Sample Adaptive Offset) 부호화기의 효율적인 하드웨어 구조를 제안한다. SAO는 HEVC에서 새롭게 채택된 루프 내 필터 기술 중 하나이다. 본 논문에서 제안하는 SAO 부호화기 하드웨어 구조는 메모리 접근 최소화 및 화소들의 처리를 간소화하기 위해 three-layered buffer를 사용한다. 또한 연산시간 및 연산량을 줄이기 위해서 4개의 화소들을 병렬적으로 에지 오프셋과 밴드 오프셋으로 분류하며, 화소들의 분류와 SAO 파라메터 적용을 2단계 파이프라인 구조로 구현하고, 하드웨어 면적을 줄이기 위해서 덧셈과 뺄셈, 쉬프트 연산, 그리고 재귀 비교기만을 사용한다. 본 논문에서 제안하는 SAO 부호화기 하드웨어 구조는 Verilog HDL로 설계하였으며, TSMC $0.18{\mu}m$ CMOS 표준 셀 라이브러리를 사용하여 합성한 결과 약 180k개의 게이트로 구현되었다. 또한, 110MHz의 동작주파수에서 4K UHD급 해상도인 $4096{\times}2160@30fps$의 실시간 처리가 가능하다.

  • PDF

성분분리에 의한 CELP 보코더의 피치 검색시간 단축에 관한 연구 (On a Reduction of Pitch Searching Time by Separating the Speech Components in the CELP Vocoder)

  • 현진일;변경진;한기천;김종재;유하영;김재석;김대식;배명진
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권1E호
    • /
    • pp.22-29
    • /
    • 1995
  • 부호여기된 선형예측(CELP) 음성부호화기는 4.8 kbps 이하의 낮은 전송 비율에서도 좋은 성능을 갖는다. CELP형 부호기의 단점은 많은 계산량을 필요로 한다는 것이다. 본 논문에서, 우리는 복잡성을 줄이면서 CELP 보코더의 음질을 유지하는 새로운 피치 검색법을 제안하였다. 그 기본 개념을 피치를 검색하고자하는 신호에 대해 음소 성분 분리를 통해 예비피치주기를 사전에 파악하고 이를 예비피치에 대해서만 본격적인 피치 검색을 수행하는 것이다. 제안한 방법을 CELP 보코더에 적용하므로써, 피침검색에서 기존의 방법에 대해 약 90%의 복잡성이 감소되었다.

  • PDF

A Study on Distributed System Construction and Numerical Calculation Using Raspberry Pi

  • Ko, Young-ho;Heo, Gyu-Seong;Lee, Sang-Hyun
    • International journal of advanced smart convergence
    • /
    • 제8권4호
    • /
    • pp.194-199
    • /
    • 2019
  • As the performance of the system increases, more parallelized data is being processed than single processing of data. Today's cpu structure has been developed to leverage multicore, and hence data processing methods are being developed to enable parallel processing. In recent years desktop cpu has increased multicore, data is growing exponentially, and there is also a growing need for data processing as artificial intelligence develops. This neural network of artificial intelligence consists of a matrix, making it advantageous for parallel processing. This paper aims to speed up the processing of the system by using raspberrypi to implement the cluster building and parallel processing system against the backdrop of the foregoing discussion. Raspberrypi is a credit card-sized single computer made by the raspberrypi Foundation in England, developed for education in schools and developing countries. It is cheap and easy to get the information you need because many people use it. Distributed processing systems should be supported by programs that connected multiple computers in parallel and operate on a built-in system. RaspberryPi is connected to switchhub, each connected raspberrypi communicates using the internal network, and internally implements parallel processing using the Message Passing Interface (MPI). Parallel processing programs can be programmed in python and can also use C or Fortran. The system was tested for parallel processing as a result of multiplying the two-dimensional arrangement of 10000 size by 0.1. Tests have shown a reduction in computational time and that parallelism can be reduced to the maximum number of cores in the system. The systems in this paper are manufactured on a Linux-based single computer and are thought to require testing on systems in different environments.

A Scalable Data Integrity Mechanism Based on Provable Data Possession and JARs

  • Zafar, Faheem;Khan, Abid;Ahmed, Mansoor;Khan, Majid Iqbal;Jabeen, Farhana;Hamid, Zara;Ahmed, Naveed;Bashir, Faisal
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권6호
    • /
    • pp.2851-2873
    • /
    • 2016
  • Cloud storage as a service provides high scalability and availability as per need of user, without large investment on infrastructure. However, data security risks, such as confidentiality, privacy, and integrity of the outsourced data are associated with the cloud-computing model. Over the year's techniques such as, remote data checking (RDC), data integrity protection (DIP), provable data possession (PDP), proof of storage (POS), and proof of retrievability (POR) have been devised to frequently and securely check the integrity of outsourced data. In this paper, we improve the efficiency of PDP scheme, in terms of computation, storage, and communication cost for large data archives. By utilizing the capabilities of JAR and ZIP technology, the cost of searching the metadata in proof generation process is reduced from O(n) to O(1). Moreover, due to direct access to metadata, disk I/O cost is reduced and resulting in 50 to 60 time faster proof generation for large datasets. Furthermore, our proposed scheme achieved 50% reduction in storage size of data and respective metadata that result in providing storage and communication efficiency.

명암도 변화값과 기하학적 패턴벡터를 이용한 차량번호판 인식 (A Vehicle License Plate Recognition Using Intensity Variation and Geometric Pattern Vector)

  • 이응주;석영수
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.369-374
    • /
    • 2002
  • 본 논문에서는 명암도 변화값과 기하학적 패턴벡터를 이용하여 실시간으로 차량번호판을 추출하고 인식하는 알고리즘을 제안하였다. 일반적으로 차량영상에서는 번호판 영역에서 문자와 배경이 뚜렷하게 구별되고, 일정한 명암도 변화를 가지면서 번호판 이외의 다른 영역보다 밀집도가 높은 특성이 있다. 따라서 본 논문에서는 이러한 성질을 이용하여 먼저 명암도 변화값을 사용하여 번호판을 추출하도록 하였으며 영상 입력과정에서 외부 환경에 따라 차량영상이 어둡거나 밝게 입력될 경우에도 동일한 추출 성능을 얻기 위하여 밝기 보정 과정을 수행하였다. 또한 추출된 번호판 영역으로부터 입력 문자의 크기, 이동 및 회전에 무관한 특성 추출을 위해 번호판 영역에서 잡음 제거와 세선화를 적용하여 전처리후 제안한 기하학적 패턴벡터를 이용하여 차량번호를 인식하도록 하였다. 제안한 방법들을 적용한 결과 기존의 원형 패턴벡터 보다 계산 속도가 빠르며, 차량번호판의 크기와 잡음에 무관하며, 불규칙한 조명 상태에서도 정확한 차량 번호를 인식할 수 있었다.

$2^n$개의 노드를 갖는 DCG 특성에 대한 병렬3치 논리회로 설계에 관한 연구 (A Study on the Parallel Ternary Logic Circuit Design to DCG Property with 2n nodes)

  • 변기영;박승용;심재환;김흥수
    • 전자공학회논문지SC
    • /
    • 제37권6호
    • /
    • pp.42-49
    • /
    • 2000
  • 본 논문에서는 2ⁿ개의 노드를 갖는 DCG 특성에 대한 병렬 3치 논리회로를 설계하는 알고리즘을 제안하였다. 회로의 집적도를 높이기 위한 다양한 연구분야 중 전송선의 신호레벨을 증가시켜줌으로써 회로내의 배선밀도를 낮출 수 있으며 병렬신호전송을 통한 신호처리의 고속화, 회로의 특성을 만족시키며 최적화할 수 있는 회로설계알고리즘은 모두 고밀도 집적회로를 구현하기 위한 유용한 수단이 될 수 있다. 본 논문에서는 특히, 노드들의 개수가 2ⁿ개로 주어진 DCG에 대하여 그 특성을 행렬방정식으로 도출해내고 이를 통해 최적화 된 병렬3치 논리회로를 설계하는 과정을 정리하여 알고리즘으로 제안하였다. 또한, 설계된 회로의 동작특성을 만족하도록 DCG의 각 노드들의 코드를 할당하는 알고리즘도 제안하였다. 본 논문에서 제안된 알고리즘에 의해 회로결선의 감소와 처리속도 향상, 비용절감 측면에서 유용하다 할 수 있다.

  • PDF