2018-04-27 Piasy
从事多媒体开发的朋友,对 YUV 绝对不陌生,但大家真的能把 YUV 彻底讲清楚吗?这次,让我们彻底揭开 YUV 的「不神秘」面纱。 采样比 人类视觉系统对亮度(luma)的敏感度高于对色度(chroma)的敏感度,因此可以对色度数据进行下采样; 采样比通常表示为 J:a:b,以表示一个宽为 J 像素、高为 2 像素的采样区域内 Y Cb Cr 的采样比: J 表示采样区域的宽度,通常为 4; a 表示第一行色度采样数; b 表示第二行色度采样与第一行色度采样的不同样点数; 继续阅读 »
2018-04-29 Lingxian Kong
什么是 TLS termination 关于 TLS termination 的具体实现原理可以自行 google,我自己也讲不清楚。但简单地说,TLS termination 通常用于负载均衡器中对 https 协议的处理。为什么要单单为 https 做处理呢?https相比与http多了安全支持,其中最关键的步骤就是建立server和client的SSL安全连接通道。HTTP使用 TCP 三次握手建立连接,客户端和服务器需要交换3个包,HTTPS除了 TCP 的三个包,还要加上 ssl 握手需要的9个包,所以一共是12个包。网上有人对 HTTP 建立连接做过测试,在该测试中是114毫秒;而HTTPS建立连接,需要耗费436毫秒 继续阅读 »
2020-10-31 jude
每个周末都花大半天时间去做的事…… 继续阅读 »
2017-07-14 Lu Huang
ASR
最近一直做实验,选择的都是TEDLIUM、AMI等开源的英文语料库,以及Switchboard语料库,而在中文上目前开源的也只有我们清华王东老师THCHS-30,之前也在上面做过实验,但是数据集只有30小时,还是不怎么痛快。今天看微信,偶然发现【北京希尔贝壳科技有限公司】开源了一个178小时的中文语料库。 简介 178小时中文普通话开源语音数据(AISHELL-ASR0009-OS1)包含400位来自中国不同口音区域的发言人。录音文本包含财经、科技、体育、娱乐等领域。录制过程在安静室内环境中,使用高保真麦克风和录音机进行。此数据库经过专业语音校对人员转写标注,并通过严格质量检验,文本正确率在95%以上。 178-hour Ch 继续阅读 »
2017-06-17 Piasy
在刚刚落幕的 WWDC17 上,苹果为我们带来了一个不小的惊喜 —— 其浏览器内核WebKit将正式支持 WebRTC,而未来基于 WebKit 内核的苹果浏览器,比如macOS High Sierra、iOS 11 中的 Safari 浏览器和Safari 技术预览版 32,都将使用到 WebRTC 技术。 ——苹果终于入伙 WebRTC 继续阅读 »
2017-03-06 KasperDeng
生产环境之运维 最近在生产环境上游历了一番,大版本升级,流量控制,问题的追根索源,甚是各种艰辛。 线上资源配置问题 池化连接 必须清楚了解业务进行设置 主要是连接数个数与闲置回收的时间: 防止连接数瓶颈。 超时设置:防止在网络抖动或者数据库不可用的状况下,业务核心线程被阻塞,连接池爆浆。 e.g. 数据库连接池 池的最小最大值(不同数据库需) 从DPCP获取连接超时 连接超时 读超时 socket超时 重试次数与每次重试相隔时间 NoSQL 容量 (dimension) TTL 连接管理 Dev提供友好的配置指引,工程公式及原理,让Ops了解当前系统在不同的部署环境下如何合理配置系统资源。 系统连接数及计算公式 客户端(e.g 继续阅读 »
2017-06-14 Renfei Yu
HTTPS 目前正在逐步得到广泛应用,本篇文章通过不断剖析HTTPS的原理,基于对此的深刻理解不断的分析其性能瓶颈。立足在安全的基础上达到与HTTP同样的性能。 HTTPS HTTPS 可以认为是 HTTP + TLS/SSL,所以我们只需要了解 TLS/SSL 原理即可。在进入原理之前,我们需要了解两个基础概念:数字证书、证书授权中心 继续阅读 »
2017-02-06 Lu Huang
在很多科研单位和企业研发部门,服务器是极少被允许连外网的,一般情况下只可以通过内网里的机器访问服务器。由于自己的经历,我曾经接触过这样一台服务器,由于有8张Tesla K80的GPU,我很想在上面安装一个kladi。因此,这里的离线指的是服务器不能访问外网,或者服务器压根不能上网。我下面的操作是在和服务器在同一内网下的Windows机器上进行的,读者也可以直接在服务器上操作(不过一般很难得到许可)。 在阅读本文之前,建议先阅读一下我之前写的文章:ubuntu 16.04在线安装kaldi,以熟悉kaldi安装的大概过程。 1. 下载kaldi并上传 从kaldi在github的代码仓库(https://github.com/k 继续阅读 »
2017-03-18 kk
其实我是一个月前,也就是寒假的时候就读完了这本书,受益匪浅。当时就想写篇博客总结一下,结果一直 拖到今天,实在是惭愧! 《代码大全》是一本非常厚实的书,总共有八百多页,读完用了一个月时间,大概每天读1~2章。 这本书从变量命名,循环语句,到代码质量,团队协作等等,对涉及到写代码的方方面面都做了讨论, 结合学术界研究和业界实践,告诉你什么是好代码,以及如何写出好代码。 继续阅读 »
2017-02-22 Lu Huang
本文主要参考的是 kaldi-asr.org,主要介绍我们在使用 kaldi 的时候可能用到的数据处理的脚本以及相关文件的信息。 简介 在运行完 kaldi 提供的例子之后,也许你想用自己的数据来建立一个系统,本节主要介绍如何准备自己的数据。请确保你使用的是例程脚本是最新的脚本。在本文中,你可以参考这些例子中有关数据准备的脚本。在每一个例子的根目录有一个 run.sh,该文件一般在开头会有若干行和数据准备有关的操作。比如在 RM 的例子中有: local/rm_data_prep.sh /export/corpora5/LDC/LDC93S3A/rm_comp || exit 1; utils/prepare_lang.sh 继续阅读 »