Hashmarks: Privacy-Preserving Benchmarks for High-Stakes AI Evaluation [2312.00645]