nalaginrut 最近的时间轴更新
nalaginrut

nalaginrut

V2EX 第 22366 号会员,加入于 2012-06-18 13:39:23 +08:00
nalaginrut 最近回复了
2015-08-05 11:43:59 +08:00
回复了 wowpanda 创建的主题 Python 求推荐 python 写的数据库和编译器项目
@wowpanda 就是告诉你不要碰工业级编译器...
2015-08-04 16:57:28 +08:00
回复了 wowpanda 创建的主题 Python 求推荐 python 写的数据库和编译器项目
@wowpanda 用高级语言写编译器并不少见,只有写工业级别的编译器才不得不用C改写,这几年又往C++靠拢。但即便如此,绝大多数语言的编译器都拥有bootstrapping这个装逼特性(虽然没什么卵用,但编译器作者普遍认为没这个就不好意思在圈内拿出手),简单来说就是能用自己编译自己,所以它们实质上都用自己(许多是高级动态语言)实现了自己的编译器。
工业级别的编译器(gcc/llvm)几乎是无法用于入门的,你可以参考这个python的项目:
http://parsingintro.sourceforge.net/
也可以看看MAL,用各种语言实现一个bootstrapping的Lisp方言,里面有Python的实现:
https://github.com/kanaka/mal
为什么手握100W还在聊树莓派?
我所知道的超酸中心都是有资源的PhD忽悠一笔资金搞起来的,然后到处拉合作,自己投入100W+个人时间做个象棋什么的... #同学这个样子是无法超越卡死怕洛夫的
@xiaoxiaoyang 你写过一次就会很简单,如果你在应用层做,我建议挑个动态语言来写,在应用层用C也很简单,内核层的话不建议带loop,做着玩倒是可以。REPL是解释器最基本的构架,最简单的情况下一行代码就能完成,你想实现shell的话相当于实现一个解释器,所以REPL是必备的。

https://en.wikipedia.org/wiki/Read%E2%80%93eval%E2%80%93print_loop
2015-07-22 19:01:24 +08:00
回复了 aiqier 创建的主题 服务器 web 服务器用到的底层技术为什么大多是线程阻塞和多路复用?
@aiqier
1、有一点要注意,查询操作可以是阻塞也可以非阻塞,epoll_wait把timeout置零其实是非阻塞的

2、epoll的优势是每次只返回准备好了的一组fd,所以这个理解你是对的

3、epoll的在底层已经实现了事件机制,每当有数据到达某个fd的时候就会产生一个事件,然后事件会触发一个callback将该fd加入就绪队列(熟悉JS的同学对这种玩法应该非常熟悉)。当上层调用epoll_wait的时候就直接返回当前的就绪队列[1];
而select则要将上层传入的fd-set遍历一次,看哪些fd可以置位的就置位,然后返回,用户还得自己再遍历一次把置位了的fd找出来[2]——在这种实现方式下我们可以很容易猜到,数组内fd数量跟select的性能是成反比的,而epoll则几乎不受fd数量影响。

4、你的理解已经很接近了,epoll在底层维护两个队列,一个是就绪队列,还有一个是软中断用的队列,原理之前已经简单介绍过了。“如果io准备好,扔到队列里”这个步骤是基于操作系统级别的中断完成的,但跟平常的中断处理是不同的,如果想了解的话可以看我之前给的第三个连接。

[1] https://www.quora.com/Network-Programming/How-is-epoll-implemented
[2] https://www.quora.com/Network-Programming/How-is-select-implemented
@xiaoxiaoyang 你的问题还是描述得不是很清楚。如果想在程序里嵌入一个shell,其实就是实现一个REPL(read-eval-print-loop)然后在程序里调用就行了。在这种情况下你并不需要修改系统shell。
2015-07-21 17:24:13 +08:00
回复了 aiqier 创建的主题 服务器 web 服务器用到的底层技术为什么大多是线程阻塞和多路复用?
@aiqier

我想有必要先梳理下几个概念,不然是无法讨论的。如果一问什么是IO复用,回答就是select/poll,那就没法谈了,因为作为poll增强版的epoll也是IO复用模型,只不过edge-trigger为异步提供了可能。

1、什么是IO复用:一次查询可以获取多个文件描述符,是IO复用的典型特征。符合这个描述的都可称为IO复用模型。相对的是accept,一次查询最多得一个结果(你可以称其为IO单用,但实际上没有这样一个名词)。值得注意的是,查询无论阻塞或者非阻塞都可以,看你怎么玩。

在这个前提下,楼主说的阻塞IO+线程,跟IO复用的方式并不是互斥的。并且在使用IO复用模型的时候,“数据好了再通知操作”是很容易实现并且也是目前已经流行起来的用法,否则epoll就没啥意义了——只不过每N个连接(N由backlog决定)需要一次查询。表面上看是在轮询,其实在大量连接请求的情况下已经不再是以往那种受人诟病的轮询等待的方式了。所以这种用法仍然是高效并且容易实现的,相对于复杂的消息模型构建要单纯得多。

2、什么是异步IO:就是非阻塞IO[2],这是同一个概念的两种表达。程序在IO操作未完成的情况下也能继续往下运行而非等待,是其特征,符合这个描述都属于异步IO。
但是我们也看到这样的一个描述非常宽泛,所以可以有许多具体的实现方式,非阻塞式IO复用就是其中一种方式。
还有一种很容易让人混淆的就是“托管异步IO”,一般就简称异步IO,但其实只是异步IO的实现形式之一,比如win下的IOCP,不需要使用者处理传输中断,发出IO请求后只需要等待完成的通知即可。这种方式并不比异步的IO复用高级多少,只不过是隐藏了底层机制,让使用者更方便而已,但对于有把控能力的编程者来说灵活性是大大降低了。
信号驱动(SIGIO)同样是其具体实现的一种。

3、信号驱动的问题:SIGIO实质上是中断驱动,只不过注册了的特定IO中断一定会产生SIGIO信号,所以说信号驱动也没问题。信号的问题在于可能会丢失,请求数密集了你就只能加队列先把事件记录下来然后逐个处理了,本质上跟轮询也没啥区别。即便如此,SIGIO对于TCP而言也就是理论上咱可以玩玩,其实没人真的敢拿来用,UDP还凑合[3]。
轮询也没什么不好的,在Linux里处理高速网络传输使用的是用软中断以类似轮询的方式处理的[4](跟前面描述的队列处理SIGIO是相似的原理),这是个很有趣的事情,事务少的时候使用轮询,当事务变多了人们开始喜欢中断,而事务足够多的时候人们却返回去使用轮询了。曾经有段时间许多人对于green thread也难以理解,好不容易掌握了多线程怎么这个世界开始玩儿单线程了。所以不要对一些东西单纯地贴标签,量变引起质变的时候你会觉得世界变化太快的。

4、没有什么是完美的,这几种模型都是shit,仍然不能解放苦逼的码奴,该你遭的时候你就知道了,人类还需要继续努力...

楼主觉得4和5更好,其实理论到了工程领域就必须要考虑复杂度和稳定性,复杂度高了稳定性就下来了,维护成本也是个问题。为什么这几年流行FP?因为不用费力担心state的变化,谁也不愿意费心费力最后搞出个维护不起的东西。相对来说性能如果可以靠堆硬件和改进算法解决是最好的。恩扯远了...

[1] https://en.wikipedia.org/wiki/Asynchronous_I/O
[2] http://www.masterraghu.com/subjects/np/introduction/unix_network_programming_v1.3/ch25lev1sec2.html
[3] 《I’ll Do It Later: Softirqs, Tasklets, Bottom Halves, Task Queues, Work Queues and Timers》. Matthew Wilcox
@xiaoxiaoyang 你是想在上位机(PC)实现一个shell专门通过串口给板子下命令?板子上跑什么OS?
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2748 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 01:58 · PVG 09:58 · LAX 17:58 · JFK 20:58
Developed with CodeLauncher
♥ Do have faith in what you're doing.