思维之海

——在云端,寻找我的星匙。

HTML/CSS是web开发人员必须学习的3门语言之二:HTML定义了网页的内容CSS描述了网页的布局JavaScript则负责定义网页的行为

Read more »

Go语言,Google研发的语言,号称系统级编程语言(那么跟Rust必然也有相似的哲学了),Go语言被誉为21世纪的C语言。Go 是一种经过精心设计的实用性语言。在有其它语言(C语言)的基础时,学习Go语言不需要过多的精力。Go可以提高程序员的生产力,适合工程项目;但是Go语言缺少抽象能力,因此代码容易重复、冗余。Go语言常常在网络、分布式编程方面体现出优势,这自然也是设计者的初衷之一。

Read more »

传播学(Communication Theory)。传播学的通常印象是学科交叉融合,从抽象结合具体,衍生出社会的理论与现象。传播学是典型的实践领先于理论的学科,需要紧跟前沿研究。学习传播学可以使生活变得更有条理,提高与人沟通的能力。

Read more »

博弈论(Game Theory)。

  • 研究互动的博弈中参与者各自的选择策略
  • 研究机智而理性的决策者之间的冲突及合作
  • 参与者必须意识到他们的决策是相互影响的

博弈论被认为是经济学最坚固的理论基础。

Read more »

《Off-Path TCP Exploit: How Wireless Routers Can Jeopardize Your Secrets》是一篇来自USENIX Security(信息安全领域四大顶级学术会议之一)2018年的会议论文。本论文从属于子领域Wireless Attacks(无线攻击)。这篇文章发现了一个timing side channel,其广泛存在于所有基于IEEE 802.11或者WIFI技术的产品上。之前TCP的injection attack一般都是因为软件漏洞,从而可以通过更新软件的方式来让漏洞消失。但是,这篇文章发现的问题是基于IEEE 802.11协议的框架设计的,因此没法利用软件的方式快速解决。这种设计上的缺陷,意味着需要对协议进行比较substantial的改动才能修复。研究员利用这个side channel,成功在多个主流操作系统(macOS, Windows, and Linux)上实施了攻击。而且只需要一台连接到无线路由器网络的设备,和一台可达的攻击服务器。接着,他们展示了一个攻击的Demo。

Among possible attacks scenarios, such as inferring the presence of connections and counting exchanged bytes, we demonstrate a particular threat where an off-path attacker can poison the web cache of an unsuspecting user within minutes (as fast as 30 seconds) under realistic network conditions.

Read more »

The Book of nature is written in the characters of geometry.

—— Galileo

计算几何(Computational Geometry)。

Read more »

《神经机器翻译前沿综述》是冯洋老师组今年新出的Paper。该论文选取了近期神经机器翻译的几个主要研究领域进行进展介绍:同声传译多模态机器翻译非自回归模型篇章翻译领域自适应多语言翻译和模型训练。

机器翻译:通过计算机将源语言句子翻译到与之语义等价的目标语言句子的过程。

神经机器翻译:使用神经网络的,端到端机器翻译。

Read more »

随着社会的发展,对正常人的研究正在引起心理学的重视。越来越多的心理学家认识到,心理学不应该只关注于心理疾病和创伤的矫正和治疗——广袤的世界中存在的是沉默的大多数,作为正常人而存在。研究这样庞大的群体,所获得的思考自然也可以延伸到更广的领域。

积极心理学Positive Psychology),关注人类的品质和价值,研究积极的情绪体验、认知过程、人格特征和创造力,并趋于幸福与美好的生活。积极心理学的研究主要集中在三个方面:主观积极体验的研究、积极人格特征的研究、积极社会环境的研究。

Read more »

这篇论文可以说是在蹭DL的热度Doesn’t matter though)。“Neural-Enhanced”指的就是把深度学习引入流媒体传输领域。另一个值得注意的关键词是“Online Learning”,即在线学习,这说明深度学习算法在这里面需要动态调整。从中可以感受到一点强化学习的影子。最后,“Live Streaming”说明是直播,也就是从单个用户端到群体的流媒体分发。

直播流媒体数据量如今已经占据了相当一部分的网络带宽。(Here

With its steady growth, market reports predict that live video will take up 17 percent of Internet video traffic by 2022.

流媒体传输中存在什么非常实在、紧急的问题?自然是网络带宽和计算资源的limitation,即时空限制。

论文提出了LiveNAS,可以动态调整服务器端的计算资源,并利用在线学习的方法提升实时的用户服务质量。

文章的CCS Concepts分类为:

  • Information systems → Multimedia streaming
  • Networks → Network resources allocation
Read more »

计图(Jittor),一个完全基于动态编译(Just-in-time),内部使用创新的元算子统一计算图的深度学习框架。计图的底层实现使用Python(编译为C++),源代码可以在计图文档(Here)中方便地查阅。

Read more »

计算机图形学。计算机图形学是利用计算机研究图形的表示、生成、处理、显示的学科;计算机图形学计算机科学中,最为活跃、得到广泛应用的分支之一。例如,计算机图形学应用在电影、游戏、计算机仿真、CAD/CAM/CAE、建筑、可视化等领域。

Read more »

《Experience Grounds Language》发表于EMNLP’20。该论文探讨了未来NLP的发展与走向。

这篇论文提出的观点和我的想法不谋而合:自然语言的学习,只基于文本是不足够的。我们必须要引入更多的世界信息。比如,多媒体知识、环境知识……

Read more »

高等计算机网络。深入学习计算机网络体系结构、协议和算法,了解掌握计算机网络的最新研究成果,学习计算机网络的基本研究方法并能够初步开展计算机网络领域的相关研究。

Read more »

阅《long-short-term-memory-networks-with-python》。所谓LSTM

这本书是给想要快速部署LSTM,对基本机器学习已经有一定工程经验的人准备的。如果想要在项目或者研究中快速入门LSTM的话。

前置知识:Python、Numpy、scikit-learn。

Better:机器学习、深度学习、Keras。

Read more »

我觉得仍然有必要以更通俗的语言来解释幻想学。因此决心阐述我眼中的幻想学。不过此篇仅仅只是一个试水,随意记写而已。如不介意,但看无妨。

我常常在各时各刻看见幻想学的影子,每每契合,喜不自胜,溢于言表。

这一方面,是因为幻想学就是来源于生活,另一方面,幻想学与现实又并不一致。

Read more »

区块链隐私保护专题论文来自于《赛博智能经济与区块链》课程论文列表的 隐私保护 专题,一共4篇。将逐一解读。文章包括:

  • 《DIZK: A Distributed Zero Knowledge Proof System》
    • 一个 zkSNARKs 算法的分布式实现
  • 《Hawk: The Blockchain Model of Cryptography and Privacy-Preserving Smart Contracts》
    • 加密实现隐私保护的通用智能合约
  • 《Bulletproofs: Short Proofs for Confidential Transactions and More》
    • 极小证据的零知识证明
  • 《BITE: Bitcoin Lightweight Client Privacy using Trusted Execution》
    • 轻量代理端的隐私保护

这几篇文章会包含一些密码学的知识(主要是零知识证明)。

Read more »

在我的理解里面,旅游和旅行的含义不同。旅游,在于游览地点和景观;旅行,则在于行进的过程。旅行可能没有一个贯穿始终的目的地,它更散漫、更自由,但是必然也更耗费时间。所以,更经济、更高效的方式,就是旅游了。这种强烈目的性的行动,自然有强烈的回馈。我希望这样的事情试可以存在的。

Read more »

Open Shortest Path First (OSPF) 协议,是互联网上当今最广泛使用的内部网关路由协议。与之对应的BGP协议,则是在外部网络之间中使用最频繁的协议。

本篇论文中提出了两种全新的对OSPF的攻击,揭示了OSPF协议在设计上的缺陷。这些新的攻击方式可以在改变路由上不被攻击者控制的路由选择时,保护攻击者不受到所谓的OSPF的“fight-back”自卫机制的困扰。

通过发现的漏洞,攻击者可以长时间地伪造大量路由拓扑信息,从而间接地控制网络内部的流量。最终可能会引起包括DoS(denial of service),窃听(eavesdropping),中间人攻击(man in the middle attacks)等后续攻击。

最后文章讨论一些减轻攻击影响的策略,并提供了一个对OSPF协议的更新补丁来增强OSPF的总体安全性。

Read more »

《Interpreting Deep Learning-Based Networking Systems》来自SIGCOMM会议,看作者是网研院的Paper。注意到题目上要对“Networking system”这个词稍加注意,结合发表人也能猜到这是(互联网)网络系统,而不是指的DNN的神经网络架构。这篇文章属于“人工智能应用于网络传输”主题中的一篇选文。通过摘要我们可以知道,深度学习通常作为一种黑箱技术存在,而本文引入了一种称为Metis的框架,通过两种典型的基于决策树、超图的方法,将DNN的模型作用转换为可解释的形式。

Read more »

Named Data Networking(NDN)是美国国家科学基金资助的五个“未来网络架构项目”之一。NDN项目可以追溯到2006年的Content-Cenric Networking(CCN)项目。NDN项目的主要目标在于:

host-centric network architecture (IP) ---> a data-centric network architecture (NDN)
Read more »

《TIMELY: RTT-based Congestion Control for the Datacenter》发表于 SIGMOD 2015。SIGMOD会议主要包含SIGMOD/PODS两个子部分,它覆盖了数据库、信息系统方面的前沿研究问题。

数据传输中心总是希望达到一种既低延迟,又有高吞吐量(high throughput)的性能效果。这篇论文尝试利用RTT的实时测量(利用NIC硬件)结果——一个时间序列,这样的时间序列显然存在一个差分,从而获得一个RTT在实时时间线上的梯度信息。

TIMELYTransport Informed by MEasurement of LatencY)接收了RTT的梯度信息,并根据RTT梯度来调整传输速率,从而保证了高带宽和低(数据包)延迟的共存。TIMELY成为了第一个使用延迟信息来在数据中心进行拥塞控制的协议,尽管它的RTT信号(由于NIC offload)比以前的基于延迟的方案少了一个数量级(in the presence of infrequent RTT signals and NIC offload)。(Veges表示受到了冒犯QAQ

Read more »

视界理论:一个关于描述子、边界、视界的理论,简称视界论

视界理论的最初提出,与作者在现实中观察到的一些现象有关。

比如,在现实中,你可能会注意到,由于尺度的不同,人类的行为活动对于广阔的宇宙空间来说几乎是无影响的,但同时对于更微小的视界,比如细菌世界(人类很难根本性地影响/根除某种细菌)、原子世界(人类很难对原子世界的电子轨道施加有效的微观影响),在很大的程度上也几乎是无影响的。

另一方面,我们有所谓的蝴蝶效应,即微小的蝴蝶振翅这一扰动,能够引起全球性的气候现象;而细菌世界中也有天花一类的案例(几近人工灭绝),原子世界也有粒子加速器(对撞强烈破坏内结构)。种种这些,都在暗示着一个全新的理论,即,关于视界的学说。

Read more »

这一篇论文来自我的一位学长,张奥。在他硕士期间入选BlockSys会议,收录于CCIS期刊上。这篇文章主要讲的是利用区块链实现去中心化的账户管理系统。在现代各类网站、应用的用户名/密码日益剧增时,人们已经越来越难以记忆、维护大量的账户资料,或者设计新的账户(目前在浏览器上已经存在内嵌的用户名密码管理系统,但这样的形式是储存在本地或者浏览器的单一账号的,信息要么容易物理性丢失,要么安全程度低)。如何通过一个统一账户接口来管理所有应用的授权、验证问题,已经成了一个值得思考的重要问题。比如,Google(邮箱)账号通常可以用来登录大量第三方网站,GitHub账号、微信账号也有类似的功能。人们不再需要频繁地注册和维护各个网站的信息和密码,只需要在有登陆需要时,链接到对应的集中账户管理平台进行授权即可。但是这样也会带来一个坏处,那就是用户的信息存储是集中管理和存放的,所以中心系统对安全和隐私的要求特别高,并且在一定程度上不如分布式系统稳定。

Read more »

这篇文章主要是记录学习吉他技术的一些笔记。

上次上吉他课还是大一。高中就因为某些神奇的原因入了吉他的坑,不过一直停留在5325和天空之城前两小节的地步。是的,我还是不想放弃,荒废得太久,有时会感觉到目标和自我的位移。相去甚远。所以我又开了一个巨坑……音乐确实可以使我安静,使我什么也不想,它也可以使我更稳定地想,更感性地想。无论如何,都是极好的。

Read more »

思维,究竟是怎样的呢?
是镜花水月,是行走的踪影,还是脑海中的回想?
虚幻和现实的界限究竟在哪里?
科学的事实和科学的思维,哪个更重要?
想必你我都曾在悠悠的思维之海之中冒险。灵光乍现,心领神会。
然而大海泛舟,随波逐流,却永不得思维的真谛……
那么,幻想的意义在哪儿呢?

幻想学的思维方式已经在人类历史中发育和成长了超过数千年历史。

从古代的神话开始,人类就已经开始试图通过基于联想的抽象,构建一个对世界的认识,包括各式各样的宗教书籍,又比如《山海经》、《荷马史诗》等史诗文学,还有相当一部分来自于近现代文学作品、抽象艺术和科学猜想等。最早期的有记载的幻想学原型,至少可以一直追溯到公元前3000年左右的美索不达米亚神话。此时,由于对世界的认识不够深入,人们往往在产生幻想时会局限于比较高的抽象层次,比如天、地、人伦等,而非更基础、更微观的层次。

在进入了科技发展比较快速的时代以后,人们对世界的认识开始变得更深入、本质化。这一时期,大概可以按工业革命开始到信息技术普及之前来划分。比较典型的幻想学产物,包括有技术类幻想,逻辑类幻想等。比如,超光速、罗素悖论。这类幻想学的核心特点在于它们具有“实验性”和“偶然性”,必须通过一定的实践积累,才能凑巧得到某个幻想(甚至,灵感)。

现代社会,信息科技高度发展,幻想的生成、传播也随之加速。原本尚能满足需求的幻想学,已经逐渐变得狭隘、落后、陈旧、不可接受了;人们急需要一种全新的、系统的、研究幻想学的方法,以探寻思维背后的奥秘!

在自然语言处理中,马尔可夫模型是基于局部的,统计方法模型一统学界,机器对自然语言是否真正理解不再成为核心考虑的问题。在机器学习中,学习方法的模型原理越来越有效,也越来越难解释。一方面,一些人作出了努力,例如:最优传输理论试图从理论解释神经网络、深度学习的几何原理([顾险峰] 蒙日-安培方程,聚类分布律,流形分布律)。一方面,新的研究方向被确定:鲁棒性、可解释性成为研究热点。知识图谱的提出、数据的可视化要求同时又促使人们思考自然的本质。联结主义(神经网络)、符号主义(符号代数)方兴未艾。

幻想,它们的描述源于真实世界,却在某一些地方有所相异;而且,大多数情况下,这些“异常”是不能被克服的——也就是,在真实世界中几乎不可能发生(当然,基于历史的)。

我们不过多地讨论对于任何一个假设的真实性的问题,转而研究它的内在规律。即,思考这样一类问题:

我们如何构造全新的、不一定真实存在的科学?又或,这样的科学,对于人类的实际科学理论研究有什么意义?……

然而,理论化地研究幻想学,提供一套研究幻想学的框架和工具,目前来看,还没有令人满意的成果。

现在,一个崭新的理论,将要被建立起来。

Read more »