V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Laynooor
V2EX  ›  问与答

一个 SQL 查询的问题

  •  
  •   Laynooor · 2019-01-12 09:44:12 +08:00 · 1722 次点击
    这是一个创建于 2173 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在有两张表,2018_word_freqt5000.

    两张表有些单词是共有的,我想列出 2018_word_freq 特有的单词。(比如两张表都有 the 这个单词,那么最后查询结果中不会出现这个词)

    2018.png

    5000.png

    这是我在 Google Bigquery 上执行的查询语句,但是返回的结果并没有排除重复的项目。

    result.png

    感觉是自己 SQL 没写对,但是网上查了半天,语句改了又改结果还是不正确……

    第 1 条附言  ·  2019-01-12 10:43:40 +08:00

    t5000 前面有空格……去掉之后再查询结果就正常了

    Snipaste_2019-01-12_10-41-05.png

    11 条回复    2019-01-12 12:22:00 +08:00
    MOONYANYI
        1
    MOONYANYI  
       2019-01-12 10:08:56 +08:00   ❤️ 1
    用 inner 查出两张表相同的,再 not in
    yasumoto
        2
    yasumoto  
       2019-01-12 10:11:39 +08:00   ❤️ 1
    select wf.* from 2018_word_freq wf where wf.word not in (SELECT word from t5000 where _______word in (wf.word));

    select wf.* from 2018_word_freq wf where wf.word not in (SELECT word from 2018_word_freq twf , t5000 t where twf.word = t._______word );

    跟楼上的思路一样 不知道是否有更有效的查询方法
    lsongiu
        3
    lsongiu  
       2019-01-12 10:17:10 +08:00   ❤️ 1
    我咋感觉 lz 本身的 sql 也能查出来才对呢。难道有空格?
    thinkif
        4
    thinkif  
       2019-01-12 10:17:14 +08:00   ❤️ 1
    是我眼花了么?仅从截图里看,2 个表中的词没有看到重复的
    Laynooor
        5
    Laynooor  
    OP
       2019-01-12 10:20:08 +08:00
    @thinkif 第一个表 2000 个单词。第二个表 5000 个单词,然后截图里显示的没有按词频排序,所以没看到重复的
    thinkif
        6
    thinkif  
       2019-01-12 10:20:59 +08:00
    @Laynooor #5
    not in
    MOONYANYI
        7
    MOONYANYI  
       2019-01-12 10:21:30 +08:00
    还可以用左外连接,再判断右表字段为 null 的
    oaix
        8
    oaix  
       2019-01-12 10:22:55 +08:00   ❤️ 1
    select a.* from 2018_word_freq a left join t5000 b on a.word = b.______word where b.______word is null

    如果你的数据库支持 left anti join 可以使用 select a.* from 2018_word_freq a left anti join t5000 b on a.word = b.______word
    thinkif
        9
    thinkif  
       2019-01-12 10:22:57 +08:00   ❤️ 1
    @Laynooor #5
    一不留神发布去了
    正常来说,not in / not exists / left join + is not null 这几种写法都可以的
    然后如 @lsongiu #3 所说,如果词中有空格干扰也可能出问题,试试 trim 掉空格或换行符之类的试试
    Laynooor
        10
    Laynooor  
    OP
       2019-01-12 10:43:09 +08:00
    @lsongiu 确实是空格的问题,第二个表前面有空格,去掉后就正常了。
    qinrui
        11
    qinrui  
       2019-01-12 12:22:00 +08:00 via iPhone
    select word from a left outer join b on a.word=b.word where b.word is null
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5034 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 01:14 · PVG 09:14 · LAX 17:14 · JFK 20:14
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.