更新:我現在用自己的ccls了。
C++代碼索引工具現狀
Tag system流派
- Universal Ctags很精妙,用正則表達式跳轉,因此文檔編輯後仍能使用。https://github.com/universal-ctags/ctags/blob/master/parsers/c.c 但不帶引用,Vim會用二分查找,大約會有log2(size/4096)次seek。
- Cscope似乎已經荒廢了。
- ID Utils
- GNU GLOBAL
libparser/C.c。用Berkeley DB存儲definition/reference/path name。帶有插件系統可以使用ctags idutils的parser。對於Emacs/Vim用戶來說,可能是tag流派中最好用的工具了。輔以一些heuristics和ripgrep等,很多用戶不覺得自己生活在水深火熱中…… - Elixir Cross Referencer
- OpenGrok
clang流派
- clang-tags荒廢。
- YouCompleteMe不夠好用,因爲只處理單一translation unit,無法查找引用。
- clangd最有前景,有大廠大項目願意採用,Xcode會用讓clangd有助益的libindexstore。但目前尚無存儲系統,因此無法處理多translation
units。作爲clang-tools-extra一部分,而clang+llvm構建/貢獻門檻高([https://reviews.llvm.org/])。對於這類工具類應用,貢獻難易程度是個重要因素。目前有嘗試引入存儲模型(MarkZ3),但目前設計較爲複雜,而實際上不帶garbage
collection的
std::vector(cquery風格)足夠應對大部分使用場景。很擔心他們走上歧路。 - Google Kythe,(mostly)
language-agnostic,概念複雜,配置困難。不重視language server
protocol,當前僅提供
ReferencesProvider,HoverProvider,DefinitionProvider,且交互使用可能有極大延遲。大多數人並不在意C++ Haskell Python代碼間無縫跳轉。https://github.com/google/kythe/tree/master/kythe/cxx/indexer/cxx - rtags可以查找引用,但每個translation
unit
6個文件
info,symbols,symnames,targets,tokens,usrs(過多),沒有使用in-memory索引,查找引用請求會讀項目所有translation units的文件。導致性能低下https://github.com/Andersbakken/rtags/issues/1007。rtags.el裏應該還有很多東西可供Emacs lsp-mode學習,有經驗的人介紹一下~ - cquery現階段的妥協。主要數據結構爲不帶garbage
collection(變量/函數/類型等的id不會回收)的
std::vector(src/indexer.h)。有一些Emacs用戶積極貢獻code navigation功能。
IDE(Any sufficiently complicated IDE contains an ad-hoc, informally-specified, bug-ridden, slow implementation of half of C++.)
cquery安裝、配置
- git clone https://github.com/jacobdufault/cquery
- 構建language server可執行文件(Arch Linux可用aur/cquery-git的
/usr/bin/cquery)./waf configure# 或用--bundled-clang=5.0.1選擇http://releases.llvm.org/上的release版本./waf build# 構建build/release/bin/cquery
- 編輯器安裝language client插件(Emacs lsp-mode、Neovim LanguageClient-neovim、VSCode安裝cquery/vscode-client裏的插件)
- 爲你的C/C++/Objective-C項目生成
compile_commands.json,參見下文。
cquery是一個C++ language server,它和編輯器端的LSP client協作流程如下:
當編輯器打開C++文件時,language client插件啓動language server進程(根據配置的language server可執行文件),用JSON-RPC 2.0協議通過stdio通信,協議規範見https://microsoft.github.io/language-server-protocol/specification。
Language client插件用initialize請求告知language
server(這裏是build/release/bin/cquery進程)自己支持的功能(ClientCapabilities)、項目路徑(rootUri)、初始化選項(initializationOptions,cquery需要知道cacheDirectory路徑)。之後各種語言相關功能都通過與language
server通信實現:
- 光標移動時向language
server發送
textDocument/hover請求,language server返回變量/函數聲明信息、註釋等。VSCode使用浮動窗口顯示,Emacs lsp-mode用eldoc顯示 - 查找定義發送
textDocument/definition請求,language server返回定義所在的文件、行列號。編輯器的可能行爲:單個結果時直接跳轉到目標文件的指定行列,如有多個候選則用菜單顯示 - 查找引用發送
textDocument/references請求,和查找定義類似 - 查找當前文檔定義的符號(常用與查找頂層的outline)發送
textDocument/documentSymbol請求,language server返回符號和行列號 - 查找項目定義的符號(只查找outline的也很有用)發送
workspace/symbol請求 - 補全
textDocument/completion,language server提供候選及排序方式,是否使用snippet,如何編輯文檔得到補全結果等 - 文檔編輯操作發送
textDocument/didChange,language server據此更新自己的模型 - cquery還支持一些Language Server
Protocol之外的擴展,比如
$cquery/derived用於查找派生的類、方法等
Emacs
參照https://github.com/jacobdufault/cquery/wiki/Emacs配置。需要安裝幾個插件:
- lsp-mode Emacs裏的LSP客戶端庫,可用於多種language server。另有lsp-rust、lsp-haskell等,可以看作適配器,包含language server相關設置。
- cquery項目中的
emacs/cquery.el。地位與lsp-rust、lsp-haskell等類似,把cquery適配到lsp-mode。另外支持cquery一些Language Server Protocol之外的擴展。 - lsp-ui
lsp-mode有計劃併入Emacs。其他UI相關或因協議等問題不適合在核心lsp-mode包的組件放在這裏。當前有:
- lsp-ui-flycheck 用language server的diagnostics信息實現flycheck的checker
- lsp-ui-sideline
即時顯示當前行所有標識符的
textDocument/hover信息 - lsp-ui-peek 基於quick-peek的
find-{definitions,references,apropos} - 未來可能添加更多code lens功能
- company-lsp
company是一個補全引擎,company-lsp爲一個backend,用
textDocument/completion信息提供補全
這些插件只有lsp-mode和cquery.el是必須的。
lsp-mode
(lsp-enable-imenu)開啓,用imenu來顯示textDocument/documentSymbol信息。跳轉到當前檔案的符號很方便。- 光標移動到標識符上會觸發
textDocument/hover,顯示類型、變量、函數等的fully qualified name,有層層namespace嵌套時容易定位。對於auto specifier,能知道具體類型。 M-x lsp-format-buffer發送textDocument/formatting。參見cquery/wiki/Formatting
xref.el
xref.el是Emacs自帶的。lsp-mode設置xref-backend-functions,讓xref.el使用lsp後端。如果不安裝其他庫,也能用以下三個函數,結果由xref.el渲染。
xref-find-definitions(默認M-.),查找定義,發送textDocument/definition請求xref-find-references(默認M-?),查找引用,發送textDocument/references請求xref-find-apropos(默認C-M-.),查找項目符號,發送workspace/symbol請求
xref-find-definitions若只有一個結果會直接跳轉,有多個則彈出菜單供用戶選擇。而xref-find-references會觸發xref--read-identifier,在minibuffer中要求讀入一個串。這顯然和期望的查找當前光標位置引用的使用方式不符。另外,lsp-mode會讀取光標處標識符的text
properties信息(其中編碼了buffer內位置信息),而prompt讀入的串是不帶text
properties的。xref-find-references會失敗。
要讓它工作,請閱讀xref-prompt-for-identifier文檔,把xref-find-references添加進xref-prompt-for-identifier。我提交了一個bug到Emacs(因爲xref.el是Emacs一部分):https://debbugs.gnu.org/cgi/bugreport.cgi?bug=29619,但maintainer需要瞭解更多用戶的反饋才會修改xref-prompt-for-identifier默認值。
cquery workspace/symbol使用了一個sequence
alignment結合詞結合性、camelCase等啓發因素的fuzzy
matching算法,以foo bar爲模式會返回fooBar foobar foozbar等,fooBar排在前面。xref-find-apropos會自作聰明地把模式用空格分割後當作正規表達式轉義,考慮自定義。
company-lsp
提供LSP的補全支持。我用spacemacs的(spacemacs|add-company-backends :backends company-lsp :modes c-mode-common)。
tumashu寫了一個company-childframe.el,可能需要人推動一下company-mode#745。
cquery.el
cquery項目中的cquery.el適配cquery到lsp-mode,同時提供一些LSP協議未定義的功能。如inactive
region,把preprocessor忽略掉的行用灰色顯示:
我用以下C/C++ mode
hook在項目根目錄有compile_commands.json時自動啓用`lsp-cquery-enable。
1 | (defun my//enable-cquery-if-compile-commands-json () |
另外一些不在LSP協議中的cquery擴展方法,如:
$cquery/base用於類型是查找base class,也可用於virtual function$cquery/derived用於類型是查找derived classes,也可用於virtual function查找被哪些derived classes override$cquery/vars查找一個類型的所有變量
另外有個$cquery/typeHierarchyTree,但還沒有人搬到Emacs,用空的話用個畫樹的庫造福其他人~
helm-xref
helm用戶可以考慮安裝helm-xref,(setq xref-show-xrefs-function 'helm-xref-show-xrefs)即可。xref-find-{definitions,references,apropos}會用helm顯示,替代xref.el的界面。
helm-xref效果如圖
。
lsp-ui-doc
使用了child frame,需要Emacs 26或以上。
Language
client中命令行設置爲cquery --language-server --enable-comments可以索引項目中的註釋(文檔)。textDocument/hover信息除了提供類型簽名,還會提供註釋。

1 | (setq lsp-ui-doc-include-signature nil) ; don't include type signature in the child frame |
lsp-ui-flycheck
1 | (with-eval-after-load 'lsp-mode |
lsp-ui-peek
lsp-ui提供了不同於xref.el的另一套交叉引用。參見其主頁的demo。
1
2
3
4
5
6
7
8
9
10
11M-x lsp-ui-peek-find-definitions
M-x lsp-ui-peek-find-references
M-x lsp-ui-peek-find-workspace-symbol
# 不要隱藏非當前文件的匹配項的
(setq lsp-ui-peek-expand-function (lambda (xs) (mapcar #'car xs)))
(define-key lsp-ui-peek-mode-map (kbd "h") 'lsp-ui-peek--select-prev-file)
(define-key lsp-ui-peek-mode-map (kbd "l") 'lsp-ui-peek--select-next-file)
(define-key lsp-ui-peek-mode-map (kbd "j") 'lsp-ui-peek--select-next)
(define-key lsp-ui-peek-mode-map (kbd "k") 'lsp-ui-peek--select-prev)
以下三個cquery擴展協議也很有用,建議設置快捷鍵。 1
2
3(lsp-ui-peek-find-custom nil "$cquery/base")
(lsp-ui-peek-find-custom nil "$cquery/callers")
(lsp-ui-peek-find-custom nil "$cquery/derived")
lsp-ui-sideline
1 | (setq lsp-ui-sideline-show-symbol nil) ; don't show symbol on the right of info |
其他
- LSP生態系統解決的一大痛點是以前對於不同語言,要使用不同工具,設置不同快捷鍵。用了language client就可以統一了。
注意textDocument/references協議中定義返回結果爲Location[] | null,只含位置信息,不包含代碼行內容。顯示行內容是lsp-mode做的。
我的配置:https://github.com/MaskRay/Config/blob/master/home/.emacs.d/layers/%2Bmy/my-code
- 希望spacemacs支持LSP。
reference-handler(類似於跳轉到定義的jump-handler)也很有用:https://github.com/syl20bnr/spacemacs/pull/9911 - lsp-mode和ggtags都會
(setq-local eldoc-documentation-function ...),對於這類minor-mode衝突問題,如果能設置優先級就能優雅解決。
Neovim
參照https://github.com/autozimu/LanguageClient-neovim/wiki/cquery。相關組件:
- LanguageClient-neovim Neovim裏的LSP客戶端
- denite 提供UI支持,顯示LanguageClient-neovim獲取的信息
- fzf 提供UI支持
- deoplete nvim-completion-manager 補全UI
- neosnippet 可以和deoplete配合,snippet
- 目前缺乏Emacs中
cquery.el的對應物,提供LSP協議未定義的cquery特定功能
1 | nn <leader>ji :Denite documentSymbol<cr> |
。
生成compile_commands.json
cquery這類Clang LibTooling工具和傳統tag-based工具的一大差別是瞭解項目中每個源文件和編譯方式。放在項目根目錄的compile_commands.json提供了這種信息。
CMake
1 | % mkdir build |
Build EAR
Bear is a tool that
generates a compilation database for clang tooling. It can be used for
any project based on Makefile.
1 | bear make |
Ninja
1 | ninja -t compdb rule_names... > compile_commands.json |
深入
cquery使用Clang的C接口libclang parse/index文件。Clang C++
API不穩定,cquery使用C++
API可能會難以適配不同Clang版本。使用--use-clang-cxx編譯選項可以用Clang
C++ API。但注意可能會顯著增加cquery構建時間。Windows
releases.llvm.org的bundled clang+llvm不帶C++頭文件。
--enable-comments可以索引項目中的註釋,VSCode渲染完美,但Emacs
Vim的顯示還在改善中。註釋的排版,如何parse
comment markers(Doxygen,standardese)還有很多爭論。
#include <algorithm>
在include行也能跳轉,但如果是項目外的文件(系統頭文件),你的LSP
client可能不會把它和之前的LSP
session關聯,你就無法在新打開的buffer中用LSP功能了。
A a;
對於聲明/定義,在a上textDocument/definition會跳到類型A的定義。在a旁邊的空格或分號會跳到constructor。因爲constructor標記爲implicit,代碼中讓implicit函數調用的範圍左右擴展一格,那麼就更容易觸發了。
A a(3);
在(或);上textDocument/definition會跳到類型constructor。
A a=f(); 如果有隱式copy/move
constructor,在(上能跳到它們。
assert(1);
在assert上會跳到#define assert,但在(1)上會跳到__assert_fail,__assert_fail來自assert
macro的展開。libclang
IndexerCallbacks.indexEntityReference回調會報告來自__assert_fail的引用,因此請不要驚訝。
auto a = std::make_unique<A>(3);
make_unique會跳轉到constructor,因爲src/indexer.cc中對make開頭的模板函數有特殊邏輯,會跳到constructor而不是make_unique的定義。
function/class
template裏有些東西有def/ref信息,但A<int>::foo()等引用跳轉不了,是因爲模板索引的困難#174。
有餘力~請更新https://github.com/jacobdufault/cquery/wiki~
問題
- Task lists https://github.com/jacobdufault/cquery/issues/30 Polish before publishing (to GitHub Marketplace)
- 需要一個妥善的on-disk
storage。很多輕量級數據庫不支持或有較難處理的問題(如果有需求把現在in-memory+JSON改成有其他存儲模型)。註記,
SQLITE_ENABLE_LOCKING_STYLE、flock很難。
其他
索引Linux kernel
1 | wget 'https://git.archlinux.org/svntogit/packages.git/plain/trunk/config?h=packages/linux' -O .config |
生成3GiB文件。
索引llvm,du -sh => 1.1GB,索引完內存佔用2G。
查看LSP requests/responses
1 | sudo sysdig -As999 --unbuffered -p '%evt.type %evt.buffer' "proc.pid=$(pgrep -fn build/app) and fd.type=pipe" | egrep -v '^Content|^$' |
希望有朝一日Debug Protocol也能獲得重視,https://github.com/Microsoft/vscode-debugadapter-node/blob/master/protocol/src/debugProtocol.ts,讓realgud輕鬆一點。
和YouCompleteMe等項目一樣,cquery默認下載prebuilt
clang+llvm,即.h .so .a。用戶不需要編譯完整的llvm,開發門檻比clangd低。
哪些源文件處理不好:
- 多executable
- X macros,一份源碼多種編譯方式
- ODR violation
- self-modifying code
- dlopen
- weak symbol(不知道鏈接命令)
感謝ngkaho1234。