{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,7]],"date-time":"2026-05-07T15:45:18Z","timestamp":1778168718963,"version":"3.51.4"},"reference-count":33,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2014,10]]},"DOI":"10.1109\/sbac-pad.2014.10","type":"proceedings-article","created":{"date-parts":[[2014,12,8]],"date-time":"2014-12-08T17:36:46Z","timestamp":1418060206000},"page":"41-48","source":"Crossref","is-referenced-by-count":6,"title":["HPCG: Preliminary Evaluation and Optimization on Tianhe-2 CPU-only Nodes"],"prefix":"10.1109","author":[{"given":"Cheng","family":"Chen","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yunfei","family":"Du","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Hao","family":"Jiang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ke","family":"Zuo","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Canqun","family":"Yang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"19","doi-asserted-by":"publisher","DOI":"10.1023\/A:1021738303840"},{"key":"17","doi-asserted-by":"publisher","DOI":"10.1145\/1837853.1693471"},{"key":"18","doi-asserted-by":"publisher","DOI":"10.1016\/j.parco.2012.03.004"},{"key":"33","doi-asserted-by":"crossref","first-page":"615","DOI":"10.1109\/ICPP.2003.1240630","article-title":"Code tiling for improving the cache performance of PDE solvers","author":"huang","year":"2003","journal-title":"2003 International Conference on Parallel Processing (ICPP'03)"},{"key":"15","doi-asserted-by":"publisher","DOI":"10.1137\/1.9780898718003"},{"key":"16","author":"saad","year":"1990","journal-title":"SPARSKIT A basic tool kit for sparse matrix computation"},{"key":"13","doi-asserted-by":"publisher","DOI":"10.1016\/j.parco.2013.04.007"},{"key":"14","doi-asserted-by":"publisher","DOI":"10.1145\/2464996.2465013"},{"key":"11","doi-asserted-by":"publisher","DOI":"10.1007\/s11390-011-0184-1"},{"key":"12","first-page":"126","article-title":"Design and Implementation of the Linpack Benchmark for Single and Multi-node Systems Based on Intel Xeon Phi Coprocessor[C]\/\/Parallel & Distributed Processing (IPDPS), 2013","author":"heinecke","year":"2013","journal-title":"IEEE 27th International Symposium on"},{"key":"21","doi-asserted-by":"publisher","DOI":"10.1016\/S0167-8191(99)00064-2"},{"key":"20","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-642-38718-0_37"},{"key":"22","article-title":"Automatically tuning sparse matrix-vector multiplication for GPU architectures","author":"monakov","year":"0","journal-title":"Proc 5th Intl Conf High Perf Embedded Architectures and Compilers HiPEAC10 Pp"},{"key":"23","doi-asserted-by":"publisher","DOI":"10.1007\/s00446-013-0203-2"},{"key":"24","author":"vuduc","year":"2003","journal-title":"Automatic performance tuning of sparse matrix kernels"},{"key":"25","doi-asserted-by":"publisher","DOI":"10.1177\/1094342004041296"},{"key":"26","doi-asserted-by":"publisher","DOI":"10.1145\/1362622.1362674"},{"key":"27","doi-asserted-by":"publisher","DOI":"10.1007\/s11390-014-1447-4"},{"key":"28","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-642-23397-5_40"},{"key":"29","doi-asserted-by":"publisher","DOI":"10.1016\/j.camwa.2009.01.034"},{"key":"3","author":"markomanolis","year":"2014","journal-title":"Performance Evaluation and Prediction of Parallel Applications[D]"},{"key":"2","first-page":"124","author":"park","year":"2014","journal-title":"Sparsifying Synchronization for High-Performance Shared-Memory Sparse Triangular Solver [C]\/\/Supercomputing"},{"key":"10","doi-asserted-by":"publisher","DOI":"10.1007\/s11704-014-3501-3"},{"key":"1","author":"lothian","year":"2013","journal-title":"Synthetic Graph Generation for Data-Intensive HPC Benchmarking Background and Framework[J]"},{"key":"30","doi-asserted-by":"publisher","DOI":"10.1109\/71.476191"},{"key":"7","author":"wu","year":"2013","journal-title":"High-Performance Architecture for the Conjugate Gradient Solver on FPGAs[J]"},{"key":"6","author":"gropp","year":"1999","journal-title":"Toward realistic performance bounds for implicit cfd codes"},{"key":"32","doi-asserted-by":"publisher","DOI":"10.1137\/0907033"},{"key":"5","first-page":"312","article-title":"Toward a new metric for ranking high performance computing systems[J]","author":"dongarra","year":"2013","journal-title":"SANDIA REPORT-SAND2013-4744"},{"key":"31","doi-asserted-by":"publisher","DOI":"10.1109\/ICPP.2010.13"},{"key":"4","doi-asserted-by":"publisher","DOI":"10.2172\/1113870"},{"key":"9","year":"2013"},{"key":"8","doi-asserted-by":"publisher","DOI":"10.1109\/71.476191"}],"event":{"name":"2014 26th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD)","location":"Jussieu, Paris, France","start":{"date-parts":[[2014,10,22]]},"end":{"date-parts":[[2014,10,24]]}},"container-title":["2014 IEEE 26th International Symposium on Computer Architecture and High Performance Computing"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/6967884\/6970630\/06970645.pdf?arnumber=6970645","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2020,8,27]],"date-time":"2020-08-27T13:58:48Z","timestamp":1598536728000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/6970645\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2014,10]]},"references-count":33,"URL":"https:\/\/doi.org\/10.1109\/sbac-pad.2014.10","relation":{},"subject":[],"published":{"date-parts":[[2014,10]]}}}